Texto de streaming para fala
Converta texto em fala com entrega de áudio em streaming em tempo real.
Principais Recursos:
- Streaming de áudio com baixa latência - a reprodução pode começar imediatamente à medida que os fragmentos chegam
- Detecção automática de idioma
- Suporte a vários formatos: MP3 ou PCM/WAV
- Áudio de alta qualidade: taxa de amostragem de 24kHz, mono de 16 bits
Corpo do Pedido:
text: Texto de entrada a ser convertido em fala - obrigatóriolanguage: Código do idioma (padrão: “auto”) - “auto” para detecção automática, ou códigos ISO 639-1: en, zh, hi, es, ar, bn, pt, ru, ja, pa, de, ko, fr, tr, it, th, pl, nl, id, vi, urformat: Formato de áudio (padrão: “mp3”) - “mp3” para áudio MPEG comprimido (96 kbps) ou “pcm” para WAV não comprimidomodel: Identificador do modelo TTS (padrão: “auto”) - “auto” seleciona o provedor padrão; um id resolvível por registro despacha para o provedor correspondente (observação: nem todos os provedores suportamformat: "mp3")
Resposta:
- Transmite fragmentos de áudio em tempo real
- Retorna o cabeçalho
X-Language-Codecom o idioma detectado/utilizado - Content-Type:
audio/mpeg(MP3) ouaudio/wav(PCM)
Casos de Uso:
- Aplicações em tempo real que exigem reprodução imediata de áudio
- Respostas interativas de voz
- Cenários de conversão de texto em fala com baixa latência
Documentation Index
Fetch the complete documentation index at: https://docs.mka1.com/llms.txt
Use this file to discover all available pages before exploring further.
Autorizações
Gateway auth: send Authorization: Bearer <mka1-api-key>. For multi-user server-side integrations, you can also send X-On-Behalf-Of: <external-user-id>.
Cabeçalhos
Optional external end-user identifier forwarded by the API gateway.
Corpo
Parâmetros de solicitação para conversão de texto para fala em streaming com seleção de idioma e opções de formato.
Texto de entrada para converter em fala
1Código da língua: 'auto' para detecção automática, ou códigos de língua ISO 639-1.
auto, en, zh, hi, es, ar, bn, pt, ru, ja, pa, de, ko, fr, tr, it, th, pl, nl, id, vi, ur Identificador do modelo TTS. O padrão é 'auto', que seleciona o provedor padrão. IDs resolvíveis no registro são enviados para o provedor correspondente.
"auto"
Formato de saída de áudio: 'mp3' para áudio MPEG (padrão) ou 'pcm' para PCM/WAV não compactado (24kHz, 16 bits, mono)
mp3, pcm Resposta
Streaming de áudio em formato MP3 ou PCM/WAV com cabeçalho de código de idioma.
MP3 audio stream (when format=mp3): 24kHz sample rate, 96 kbps bitrate, 16-bit, mono