from openapi import SDK
with SDK(
bearer_auth="<YOUR_BEARER_TOKEN_HERE>",
) as sdk:
res = sdk.llm.speech.speak_streaming(text="Hello, welcome to our text-to-speech service.", language="en", format_="mp3")
# Handle response
print(res)"(binary)"Convierte texto a voz con entrega de audio en streaming en tiempo real.
Características Clave:
Cuerpo de la Solicitud:
text: Texto de entrada a convertir a voz - requeridolanguage: Código de idioma (por defecto: “auto”) - “auto” para detección automática, o códigos ISO 639-1: en, zh, hi, es, ar, bn, pt, ru, ja, pa, de, ko, fr, tr, it, th, pl, nl, id, vi, urformat: Formato de audio (por defecto: “mp3”) - “mp3” para audio MPEG comprimido (96 kbps) o “pcm” para WAV sin comprimirRespuesta:
X-Language-Code con el idioma detectado/utilizadoaudio/mpeg (MP3) o audio/wav (PCM)Casos de Uso:
from openapi import SDK
with SDK(
bearer_auth="<YOUR_BEARER_TOKEN_HERE>",
) as sdk:
res = sdk.llm.speech.speak_streaming(text="Hello, welcome to our text-to-speech service.", language="en", format_="mp3")
# Handle response
print(res)"(binary)"Gateway auth: send Authorization: Bearer <mka1-api-key>. For multi-user server-side integrations, you can also send X-On-Behalf-Of: <external-user-id>.
Parámetros de solicitud para la conversión de texto a voz por streaming con selección de idioma y opciones de formato.
Texto de entrada para convertir a voz
1Código de idioma: 'auto' para detección automática, o códigos de idioma ISO 639-1
auto, en, zh, hi, es, ar, bn, pt, ru, ja, pa, de, ko, fr, tr, it, th, pl, nl, id, vi, ur Formato de salida de audio: 'mp3' para audio MPEG (predeterminado), o 'pcm' para PCM/WAV sin comprimir (24 kHz, 16 bits, mono)
mp3, pcm Transmisión de audio en formato MP3 o PCM/WAV con encabezado de código de idioma
MP3 audio stream (when format=mp3): 24kHz sample rate, 96 kbps bitrate, 16-bit, mono
¿Esta página le ayudó?