Saltar para o conteúdo principal
A API MKA1 pode retornar texto, áudio e imagens. Texto é a modalidade de saída padrão. Use modalities e audio para habilitar a saída de fala, ou adicione a ferramenta image_generation para produzir imagens.

Tipos de saída suportados

ModalidadeComo habilitarFormato de saída
TextoPadrão — nenhuma configuração extraoutput_text na resposta
Áudio (fala)Defina modalities: ["text", "audio"]Áudio em Base64 + transcrição
ImagemAdicione a ferramenta image_generationURL da imagem ou base64

Gerar áudio (texto para fala)

Solicite a saída de áudio definindo modalities como ["text", "audio"] e especificando uma voz e formato no parâmetro audio. A resposta inclui tanto a transcrição do texto quanto os dados de áudio codificados em base64.

Configuração de áudio

ParâmetroOpçõesPadrão
voicealloy e outros perfis de vozalloy
formatwav, mp3, flac, opus, pcm16wav
O áudio é sintetizado a 24 kHz, 16-bit mono.
import { SDK } from '@meetkai/mka1';

const mka1 = new SDK({
  bearerAuth: `Bearer ${YOUR_API_KEY}`,
});

const result = await mka1.llm.responses.create({
  model: 'meetkai:functionary-swahili-large',
  input: 'Say hello in a friendly way. Keep it very short.',
  modalities: ['text', 'audio'],
  audio: { voice: 'alloy', format: 'wav' },
}, { headers: { 'X-On-Behalf-Of': '<end-user-id>' } });

// The output includes an output_audio item with base64 data and a transcript

Salvar áudio em um arquivo

import { writeFileSync } from 'fs';

const result = await mka1.llm.responses.create({
  model: 'meetkai:functionary-swahili-large',
  input: 'Read this sentence aloud: The quick brown fox jumps over the lazy dog.',
  modalities: ['text', 'audio'],
  audio: { voice: 'alloy', format: 'mp3' },
});

// Find the audio output in the response
const audioItem = result.output.find((item) => item.type === 'output_audio');
if (audioItem) {
  const audioBuffer = Buffer.from(audioItem.data, 'base64');
  writeFileSync('output.mp3', audioBuffer);
}

Idiomas suportados

A saída de áudio suporta detecção automática de idioma e mais de 20 idiomas, incluindo inglês, chinês, hindi, espanhol, árabe, bengali, português, russo, japonês, punjabi, alemão, coreano, francês, turco, italiano, tailandês, polonês, holandês, indonésio, vietnamita e urdu.

Gerar imagens

Use a ferramenta image_generation para criar imagens a partir de prompts de texto. O modelo interpreta sua mensagem, gera um prompt para o modelo de imagem e retorna o resultado.

Modelos de geração de imagem

ModeloMelhor para
meetkai:flux-2-kleinGeração rápida, uso geral (padrão)
meetkai:z-image-turboImagens de alta qualidade e detalhadas

Opções de geração de imagem

ParâmetroOpçõesPadrão
size1024x1024, 1024x1536, 1536x1024, autoauto
qualitylow, medium, high, autoauto
output_formatpng, webp, jpegpng
backgroundtransparent, opaque, autoauto
import { SDK } from '@meetkai/mka1';

const mka1 = new SDK({
  bearerAuth: `Bearer ${YOUR_API_KEY}`,
});

const result = await mka1.llm.responses.create({
  model: 'meetkai:functionary-swahili-large',
  input: 'Generate an image of a sunset over a mountain lake.',
  tools: [
    {
      type: 'image_generation',
      model: 'meetkai:flux-2-klein',
      quality: 'high',
      size: '1024x1024',
      output_format: 'png',
    },
  ],
}, { headers: { 'X-On-Behalf-Of': '<end-user-id>' } });

// The output includes an image_generation_call item with a result URL
const imageCall = result.output.find((item) => item.type === 'image_generation_call');
console.log('Image URL:', imageCall?.result);

Forçar geração de imagem

Use tool_choice para garantir que o modelo gere uma imagem em vez de responder apenas com texto.
const result = await mka1.llm.responses.create({
  model: 'meetkai:functionary-swahili-large',
  input: 'A red circle on a white background.',
  tools: [{ type: 'image_generation' }],
  toolChoice: { type: 'image_generation' },
});

Estrutura da saída de imagem

O array output da resposta contém estes itens quando uma imagem é gerada:
  1. function_call — a chamada do modelo para a ferramenta de geração de imagem com o prompt refinado
  2. image_generation_call — o resultado da geração com status: "completed" e result (URL da imagem)
  3. function_call_output — a saída bruta da ferramenta contendo a URL
  4. message — a resposta de texto do modelo descrevendo ou referenciando a imagem
As URLs de imagem expiram após 1 hora. Faça o download ou armazene-as em cache se precisar de acesso de longo prazo.

APIs independentes

Para acesso direto sem passar pela API Responses, a MKA1 também fornece endpoints independentes:

API de texto para fala

const ttsResult = await mka1.llm.speech.speak({
  text: 'Hello, welcome to the MKA1 platform.',
  language: 'en',
});

API de imagens

const imageResult = await mka1.llm.images.generate({
  model: 'meetkai:z-image-turbo',
  prompt: 'A futuristic city skyline at dusk',
  size: '1024x1024',
  quality: 'hd',
});

Próximos passos