Use this file to discover all available pages before exploring further.
A API de Respostas aceita texto, imagens, áudio e arquivos em uma única solicitação.
Use o campo estruturado input com arrays de conteúdo para combinar modalidades.
Envie uma imagem para o modelo descrever, analisar ou responder perguntas sobre ela.
Forneça a imagem como uma URL, um data URI base64 ou um file_id previamente enviado.
Envie áudio para o modelo processar. O áudio é automaticamente transcrito e o modelo responde ao conteúdo falado.Formatos suportados: WAV e MP3 (máx. 25 MB).
O modelo transcreve automaticamente o áudio e responde ao conteúdo falado. Por exemplo, ao enviar um arquivo WAV contendo “Hello, how are you today?” retorna:
{ "status": "completed", "output": [ { "type": "message", "role": "assistant", "content": [ { "type": "output_text", "text": "Hello! I'm doing well, thank you for asking. I'm here and ready to help you with any questions or tasks you might have. How can I assist you today?" } ] } ]}
Envie documentos para o modelo ler e raciocinar sobre eles.
PDFs e documentos digitalizados são processados automaticamente com OCR — não é necessária configuração extra.
PDFs digitalizados e imagens de documentos são processados automaticamente. A API utiliza OCR para extrair texto de:
Páginas PDF digitalizadas (convertidas em imagens a 150 DPI, depois OCR)
Fotos de documentos (JPEG, PNG, TIFF)
Arquivos Office (DOCX, XLSX, PPTX — convertidos para PDF primeiro, depois OCR)
Documentos com várias páginas são processados em paralelo. O texto extraído é retornado como Markdown e enviado ao modelo para raciocínio.Nenhum parâmetro especial é necessário — basta enviar o arquivo como input_file e o pipeline cuida da detecção, conversão e OCR.