Saltar al contenido principal
POST
/
api
/
v1
/
llm
/
speech
/
tts
/
stream
Python (SDK)
from openapi import SDK


with SDK(
    bearer_auth="<YOUR_BEARER_TOKEN_HERE>",
) as sdk:

    res = sdk.llm.speech.speak_streaming(text="Hello, welcome to our text-to-speech service.", language="en", format_="mp3")

    # Handle response
    print(res)
"(binary)"

Autorizaciones

Authorization
string
header
requerido

Gateway auth: send Authorization: Bearer <mka1-api-key>. For multi-user server-side integrations, you can also send X-On-Behalf-Of: <external-user-id>.

Cuerpo

application/json

Parámetros de solicitud para la conversión de texto a voz por streaming con selección de idioma y opciones de formato.

text
string
requerido

Texto de entrada para convertir a voz

Minimum string length: 1
language
enum<string>
predeterminado:auto

Código de idioma: 'auto' para detección automática, o códigos de idioma ISO 639-1

Opciones disponibles:
auto,
en,
zh,
hi,
es,
ar,
bn,
pt,
ru,
ja,
pa,
de,
ko,
fr,
tr,
it,
th,
pl,
nl,
id,
vi,
ur
format
enum<string>
predeterminado:mp3

Formato de salida de audio: 'mp3' para audio MPEG (predeterminado), o 'pcm' para PCM/WAV sin comprimir (24 kHz, 16 bits, mono)

Opciones disponibles:
mp3,
pcm

Respuesta

Transmisión de audio en formato MP3 o PCM/WAV con encabezado de código de idioma

MP3 audio stream (when format=mp3): 24kHz sample rate, 96 kbps bitrate, 16-bit, mono