Envie grandes volumes de solicitações de forma assíncrona usando a API de Lotes. Processe conclusões de chat, embeddings e gerações de imagens em massa com uma janela de conclusão de 24 horas.
Use this file to discover all available pages before exploring further.
A API de Lotes permite que você envie grupos de solicitações como um único trabalho que é processado de forma assíncrona.
Isso é útil quando você precisa executar muitas solicitações e não precisa dos resultados imediatamente — por exemplo, ao rodar avaliações, gerar embeddings para um grande conjunto de dados ou classificar conteúdo em massa.As solicitações em lote são executadas dentro de uma janela de conclusão de 24 horas e possuem limites de taxa separados e mais altos do que as chamadas síncronas da API.
Faça polling do lote até que ele atinja um status final.
mka1 llm batches get --batch-id batch_abc123
Aqui está um auxiliar de polling que espera o lote finalizar:
# Faça polling de um lote até atingir um status final usando --jq e um loop de shell.BATCH_ID=batch_abc123while :; do STATUS=$(mka1 llm batches get --batch-id "$BATCH_ID" --jq '.status' --output-format json) echo "status: $STATUS" case "$STATUS" in completed|failed|cancelled|expired) break ;; esac sleep 2done
Quando o lote estiver completed, baixe o arquivo de saída. Ele é um arquivo JSONL onde cada linha contém o custom_id que você forneceu, a resposta e qualquer erro.
# Baixe o arquivo de saída JSONLmka1 llm files content \ --file-id file_xyz789 \ --output-file ./batch_output.jsonl# Inspecione os resultados inline com jqmka1 llm files content --file-id file_xyz789 \ --jq '"\(.custom_id): status=\(.response.status_code)"'
Cada linha do arquivo de saída tem esta estrutura:
Se uma solicitação falhar, response será null e error conterá os detalhes:
{ "id": "response_def456", "custom_id": "request-2", "response": null, "error": { "code": "processing_error", "message": "The request could not be processed." }}
Se houver solicitações com falha, o lote também fornece um error_file_id contendo apenas as entradas que falharam.