Nesse material você encontra todo o passo a passo para criação de um RAG em Python conforme ensinado no material teórico.
O que você encontrará aqui
- Criação de RAG via retriever
- Criação de RAG via system context
- Visualização do .faiss
- Geração de gráficos dos embeddings
requirements.txt
Para instalação crie o arquivo requirements.txt em sua máquina e execute:
pip install -r requirements.txt
- RAG + Retriever
- RAG + Context
Qual a vantagem de cada modelo?
1) RAG + RETRIEVER
✅ Vantagens:
- Abstração pronta da LangChain: cuida do fluxo completo:
- Usa o
retriever para buscar os documentos.
- Insere automaticamente os chunks recuperados no
prompt do LLM.
- Executa a resposta.
- Menos código: você escreve pouco e já tem o pipeline completo (retrieve + generate).
- Retorna fontes se
return_source_documents=True.
❌ Limitações:
- Menor controle sobre o
prompt: o template usado é fixo.
- Menor flexibilidade para customizar o formato da resposta ou lógica intermediária.
- RAG + CONTEXT
✅ Vantagens:
- Controle total do prompt: você pode escrever o system prompt como quiser (ex: com regras, tom de voz, persona etc).
- Customização: ideal se você precisa integrar regras de negócio, respostas com formatos específicos ou lógica complexa.
- Mais próximo da API original da OpenAI.
❌ Limitações:
- Você precisa buscar os documentos manualmente com o retriever e passar o
contexto como string.
- Mais código e mais responsabilidade (ex: truncar se o
contexto ficar grande demais para o token limit).
SCRIPTS EXTRAS
- Geração de gráfico dos embeddings
- Visualizar FAISS
PDF TEORIA