RAG - Arquivos das aulas

Nesse material você encontra todo o passo a passo para criação de um RAG em Python conforme ensinado no material teórico.

Para instalação crie o arquivo requirements.txt em sua máquina e execute:

pip install -r requirements.txt

Qual a vantagem de cada modelo?

1) RAG + RETRIEVER

Abstração pronta da LangChain: cuida do fluxo completo:
1. Usa o retriever para buscar os documentos.
2. Insere automaticamente os chunks recuperados no prompt do LLM.
3. Executa a resposta.
Menos código: você escreve pouco e já tem o pipeline completo (retrieve + generate).
Retorna fontes se return_source_documents=True.

Menor controle sobre o prompt: o template usado é fixo.
Menor flexibilidade para customizar o formato da resposta ou lógica intermediária.

Controle total do prompt: você pode escrever o system prompt como quiser (ex: com regras, tom de voz, persona etc).
Customização: ideal se você precisa integrar regras de negócio, respostas com formatos específicos ou lógica complexa.
Mais próximo da API original da OpenAI.

Você precisa buscar os documentos manualmente com o retriever e passar o contexto como string.
Mais código e mais responsabilidade (ex: truncar se o contexto ficar grande demais para o token limit).

SCRIPTS EXTRAS