Pular para o conteúdo principal
POST
/
api
/
v1
/
llm
/
speech
/
tts
/
stream
Python (SDK)
from openapi import SDK


with SDK(
    bearer_auth="<YOUR_BEARER_TOKEN_HERE>",
) as sdk:

    res = sdk.llm.speech.speak_streaming(text="Hello, welcome to our text-to-speech service.", language="en", format_="mp3")

    # Handle response
    print(res)
"(binary)"

Autorizações

Authorization
string
header
obrigatório

Gateway auth: send Authorization: Bearer <mka1-api-key>. For multi-user server-side integrations, you can also send X-On-Behalf-Of: <external-user-id>.

Corpo

application/json

Parâmetros de solicitação para conversão de texto para fala em streaming com seleção de idioma e opções de formato.

text
string
obrigatório

Texto de entrada para converter em fala

Minimum string length: 1
language
enum<string>
padrão:auto

Código de idioma: 'auto' para detecção automática, ou códigos de idioma ISO 639-1.

Opções disponíveis:
auto,
en,
zh,
hi,
es,
ar,
bn,
pt,
ru,
ja,
pa,
de,
ko,
fr,
tr,
it,
th,
pl,
nl,
id,
vi,
ur
format
enum<string>
padrão:mp3

Formato de saída de áudio: 'mp3' para áudio MPEG (padrão) ou 'pcm' para PCM/WAV não comprimido (24kHz, 16-bit, mono)

Opções disponíveis:
mp3,
pcm

Resposta

Transmissão de áudio em formato MP3 ou PCM/WAV com cabeçalho de código de idioma

MP3 audio stream (when format=mp3): 24kHz sample rate, 96 kbps bitrate, 16-bit, mono