history fornece aos modelos memória de longo prazo que persiste entre sessões.
Quando habilitada, cada par de requisição-resposta é automaticamente armazenado e indexado.
O modelo pode então pesquisar semanticamente as interações anteriores para recuperar informações de conversas passadas.
Como funciona
- Adicione
{ type: "history" }ao arraytoolsna sua requisição - O modelo recebe uma função
historyque pode chamar com uma consulta de busca - As conversas anteriores são pesquisadas usando embeddings vetoriais para similaridade semântica
- Após cada resposta ser concluída, a mensagem do usuário e a resposta do assistente são armazenadas automaticamente em segundo plano
X-On-Behalf-Of possui um histórico separado. Diferentes usuários finais não podem ver o histórico uns dos outros.
Habilitar a ferramenta history
store: true para que a conversa seja persistida e fique disponível para recuperação futura.
Recuperar informações de uma sessão anterior
Em uma requisição posterior — mesmo minutos, horas ou dias depois — o modelo pode pesquisar seu histórico para encontrar interações relevantes do passado. O modelo decide quando chamar a ferramenta history com base na pergunta do usuário.Exemplo completo: armazenar e recuperar entre sessões
Este exemplo mostra o fluxo completo — armazenando informações em uma requisição e recuperando-as em uma requisição separada.Detalhes de comportamento
| Aspecto | Detalhe |
|---|---|
| Armazenamento | Automático — cada par requisição/resposta é indexado após a resposta ser concluída |
| Busca | Semântica — usa embeddings vetoriais, não correspondência por palavras-chave |
| Escopo | Por usuário final — isolado pelo header X-On-Behalf-Of |
| Indexação | Em segundo plano — não adiciona latência à resposta |
| Resultados | Até 10 interações passadas mais relevantes retornadas por busca |
| Tamanho da entrada | Texto truncado em 7.500 caracteres por entrada para embedding |
Quando usar a ferramenta history
- Personalização: Lembrar preferências, nomes ou contexto do usuário entre sessões
- Continuidade de projetos: Recuperar decisões, prazos ou requisitos discutidos anteriormente
- Fluxos de suporte: Manter contexto sobre o histórico de problemas de um usuário
- Assistentes: Construir assistentes que aprendem e se adaptam a usuários individuais ao longo do tempo
Próximos passos
- Conversas — gerenciar trocas de múltiplos turnos dentro de uma única sessão
- Arquivos e vector stores — armazenar e pesquisar documentos
- Gerar uma resposta — requisições de texto e trocas de múltiplos turnos