Saltar al contenido principal

Documentation Index

Fetch the complete documentation index at: https://docs.mka1.com/llms.txt

Use this file to discover all available pages before exploring further.

Utiliza el modo background cuando una respuesta pueda tardar mucho tiempo en completarse, como en el uso de herramientas de varios pasos o tareas de generación grandes. La API responde de inmediato con una respuesta en cola, y puedes recuperar el resultado más tarde mediante sondeo o streaming.

Crear una respuesta en segundo plano

Establece background en true y stream en false. La API crea la respuesta, comienza a procesarla de forma asíncrona y responde de inmediato con status: "queued".
mka1 llm responses create \
  --background \
  --model meetkai:functionary-es-mini \
  --input '"Write a 500-word essay about the history of the internet."' \
  -H 'X-On-Behalf-Of: <end-user-id>'
Guarda el id para recuperar el resultado más adelante.

Sondear para obtener el resultado

Llama a GET /responses/{response_id} hasta que el estado alcance un estado terminal.
mka1 llm responses get --response-id resp_abc123
Una respuesta pasa por estos estados mientras se procesa:
EstadoSignificado
queuedLa solicitud está esperando ser procesada
in_progressEl modelo está generando la salida
completedLa generación finalizó correctamente
failedOcurrió un error durante el procesamiento
incompleteLa respuesta se cortó (por ejemplo, límite de tokens)
cancelledLa respuesta fue cancelada antes de completarse
Sondea a un intervalo razonable (por ejemplo, cada dos segundos) hasta que el estado ya no sea queued o in_progress.

Recibir eventos de una respuesta en segundo plano

Si deseas actualizaciones en tiempo real en lugar de sondeo, recupera la respuesta con stream establecido en true. La API devuelve eventos enviados por el servidor a medida que se procesa la respuesta.
mka1 llm responses get --response-id resp_abc123 --stream
Los eventos llegan a medida que se producen. El flujo se cierra después de un evento terminal como response.completed o response.failed. Si la respuesta ya se ha completado cuando llamas a este endpoint, recibes un solo evento terminal con la respuesta final y el flujo se cierra inmediatamente.

Recibir eventos al momento de la creación

También puedes recibir eventos directamente al crear una respuesta en segundo plano estableciendo tanto background como stream en true.
mka1 llm responses create \
  --background \
  --stream \
  --model meetkai:functionary-es-mini \
  --input '"Write a 500-word essay about the history of the internet."'
El primer evento es response.queued, seguido de response.created, eventos intermedios como response.output_text.delta y finalmente un evento terminal como response.completed. Esto es útil cuando quieres mostrar el progreso en una interfaz de usuario mientras el trabajo se ejecuta en segundo plano. Si el cliente se desconecta, la respuesta sigue procesándose y puede recuperarse más tarde.

Cancelar una respuesta en segundo plano

Si ya no necesitas el resultado, cancela una respuesta en cola o en progreso.
mka1 llm responses cancel --response-id resp_abc123
El estado de la respuesta cambia a cancelled. Las respuestas que ya han finalizado o fallado no pueden ser canceladas.

Próximos pasos