from openapi import SDK
with SDK(
bearer_auth="<YOUR_BEARER_TOKEN_HERE>",
) as sdk:
res = sdk.llm.speech.speak_streaming(text="Hello, welcome to our text-to-speech service.", language="en", format_="mp3")
# Handle response
print(res)"(binary)"Converta texto em fala com entrega de áudio em tempo real.
Principais Recursos:
Corpo da Solicitação:
text: Texto de entrada a ser convertido em fala - obrigatóriolanguage: Código do idioma (padrão: “auto”) - “auto” para detecção automática, ou códigos ISO 639-1: en, zh, hi, es, ar, bn, pt, ru, ja, pa, de, ko, fr, tr, it, th, pl, nl, id, vi, urformat: Formato de áudio (padrão: “mp3”) - “mp3” para áudio MPEG comprimido (96 kbps) ou “pcm” para WAV sem compressãoResposta:
X-Language-Code com o idioma detectado/usadoaudio/mpeg (MP3) ou audio/wav (PCM)Casos de Uso:
from openapi import SDK
with SDK(
bearer_auth="<YOUR_BEARER_TOKEN_HERE>",
) as sdk:
res = sdk.llm.speech.speak_streaming(text="Hello, welcome to our text-to-speech service.", language="en", format_="mp3")
# Handle response
print(res)"(binary)"Gateway auth: send Authorization: Bearer <mka1-api-key>. For multi-user server-side integrations, you can also send X-On-Behalf-Of: <external-user-id>.
Parâmetros de solicitação para conversão de texto para fala em streaming com seleção de idioma e opções de formato.
Texto de entrada para converter em fala
1Código de idioma: 'auto' para detecção automática, ou códigos de idioma ISO 639-1.
auto, en, zh, hi, es, ar, bn, pt, ru, ja, pa, de, ko, fr, tr, it, th, pl, nl, id, vi, ur Formato de saída de áudio: 'mp3' para áudio MPEG (padrão) ou 'pcm' para PCM/WAV não comprimido (24kHz, 16-bit, mono)
mp3, pcm Transmissão de áudio em formato MP3 ou PCM/WAV com cabeçalho de código de idioma
MP3 audio stream (when format=mp3): 24kHz sample rate, 96 kbps bitrate, 16-bit, mono
Esta página foi útil?