Voltar ao índice
Design e UI Fonte oficial

RAG com LangChain: documentos, embeddings e vetores

Orienta a criação de sistemas RAG com carregamento e divisão de documentos, embeddings da OpenAI e bancos vetoriais.

Ver código no GitHub Instala diretamente do repositório-fonte.

O que esta skill faz

Esta skill organiza a implementação de geração aumentada por recuperação com LangChain. Ela cobre loaders, RecursiveCharacterTextSplitter, embeddings da OpenAI e opções de armazenamento vetorial como Chroma, FAISS e Pinecone.

Quando usar

  • Criar um assistente que consulte documentos antes de responder
  • Dividir arquivos extensos em trechos adequados para recuperação
  • Gerar embeddings da OpenAI para conteúdo textual
  • Indexar e pesquisar vetores com Chroma, FAISS ou Pinecone

Como usar

  1. Revise o repositório para identificar formatos de documentos, dependências e fluxo atual
  2. Escolha o document loader compatível com as fontes presentes
  3. Configure a divisão dos textos com RecursiveCharacterTextSplitter
  4. Gere embeddings e conecte o vector store escolhido
  5. Valide a recuperação com consultas representativas antes de integrar a geração

O que revisar antes de instalar

  • A fonte não define parâmetros ideais de chunking ou recuperação
  • O uso de embeddings da OpenAI exige configuração e credenciais próprias
  • Chroma, FAISS e Pinecone têm operação e infraestrutura distintas
Conteúdo-fonte não hospedado

Para respeitar a licença do repositório, o conteúdo completo permanece no GitHub.

Abrir arquivo original