Python (SDK)

from meetkai_mka1 import SDK


with SDK(
    bearer_auth="<YOUR_BEARER_TOKEN_HERE>",
) as sdk:

    res = sdk.llm.speech.speak_streaming(text="Hello, welcome to our text-to-speech service.", language="en", model="auto", store=False, format_="mp3")

    # Handle response
    print(res)

import { SDK } from "@meetkai/mka1";

const sdk = new SDK({
  bearerAuth: "<YOUR_BEARER_TOKEN_HERE>",
});

async function run() {
  const result = await sdk.llm.speech.speakStreaming({
    textToSpeechStreamingRequest: {
      text: "Hello, welcome to our text-to-speech service.",
      language: "en",
    },
  });

  console.log(result);
}

run();

using MeetKai.MKA1;
using MeetKai.MKA1.Types.Components;

var sdk = new SDK(bearerAuth: "<YOUR_BEARER_TOKEN_HERE>");

var res = await sdk.Llm.Speech.SpeakStreamingAsync(body: new MeetKai.MKA1.Types.Components.TextToSpeechStreamingRequest() {
    Text = "Hello, welcome to our text-to-speech service.",
    Language = TextToSpeechStreamingRequestLanguage.En,
});

// handle response

curl --request POST \
  --url https://apigw.mka1.com/api/v1/llm/speech/tts/stream \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "text": "Hello, welcome to our text-to-speech service.",
  "language": "en",
  "format": "mp3"
}
'

const options = {
  method: 'POST',
  headers: {Authorization: 'Bearer <token>', 'Content-Type': 'application/json'},
  body: JSON.stringify({
    text: 'Hello, welcome to our text-to-speech service.',
    language: 'en',
    format: 'mp3'
  })
};

fetch('https://apigw.mka1.com/api/v1/llm/speech/tts/stream', options)
  .then(res => res.json())
  .then(res => console.log(res))
  .catch(err => console.error(err));

<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://apigw.mka1.com/api/v1/llm/speech/tts/stream",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_ENCODING => "",
  CURLOPT_MAXREDIRS => 10,
  CURLOPT_TIMEOUT => 30,
  CURLOPT_HTTP_VERSION => CURL_HTTP_VERSION_1_1,
  CURLOPT_CUSTOMREQUEST => "POST",
  CURLOPT_POSTFIELDS => json_encode([
    'text' => 'Hello, welcome to our text-to-speech service.',
    'language' => 'en',
    'format' => 'mp3'
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: Bearer <token>",
    "Content-Type: application/json"
  ],
]);

$response = curl_exec($curl);
$err = curl_error($curl);

curl_close($curl);

if ($err) {
  echo "cURL Error #:" . $err;
} else {
  echo $response;
}

package main

import (
	"fmt"
	"strings"
	"net/http"
	"io"
)

func main() {

	url := "https://apigw.mka1.com/api/v1/llm/speech/tts/stream"

	payload := strings.NewReader("{\n  \"text\": \"Hello, welcome to our text-to-speech service.\",\n  \"language\": \"en\",\n  \"format\": \"mp3\"\n}")

	req, _ := http.NewRequest("POST", url, payload)

	req.Header.Add("Authorization", "Bearer <token>")
	req.Header.Add("Content-Type", "application/json")

	res, _ := http.DefaultClient.Do(req)

	defer res.Body.Close()
	body, _ := io.ReadAll(res.Body)

	fmt.Println(string(body))

}

HttpResponse<String> response = Unirest.post("https://apigw.mka1.com/api/v1/llm/speech/tts/stream")
  .header("Authorization", "Bearer <token>")
  .header("Content-Type", "application/json")
  .body("{\n  \"text\": \"Hello, welcome to our text-to-speech service.\",\n  \"language\": \"en\",\n  \"format\": \"mp3\"\n}")
  .asString();

require 'uri'
require 'net/http'

url = URI("https://apigw.mka1.com/api/v1/llm/speech/tts/stream")

http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true

request = Net::HTTP::Post.new(url)
request["Authorization"] = 'Bearer <token>'
request["Content-Type"] = 'application/json'
request.body = "{\n  \"text\": \"Hello, welcome to our text-to-speech service.\",\n  \"language\": \"en\",\n  \"format\": \"mp3\"\n}"

response = http.request(request)
puts response.read_body

"(binary)"

Speech

Texto de streaming para fala

Converta texto em fala com entrega de áudio em streaming em tempo real.

Principais recursos:

Streaming de áudio com baixa latência — a reprodução pode começar imediatamente à medida que os blocos chegam
Detecção automática de idioma
Suporte a múltiplos formatos: MP3 ou PCM/WAV
Áudio de alta qualidade: taxa de amostragem de 24 kHz, mono de 16 bits

Corpo da requisição:

text: Texto de entrada a ser convertido em fala - obrigatório
language: Código do idioma (padrão: “auto”) - “auto” para detecção automática, ou códigos ISO 639-1: en, zh, hi, es, ar, bn, pt, ru, ja, pa, de, ko, fr, tr, it, th, pl, nl, id, vi, ur
format: Formato de áudio (padrão: “mp3”) - “mp3” para áudio MPEG compactado (96 kbps) ou “pcm” para WAV não compactado
model: Identificador do modelo de TTS (padrão: “auto”) - “auto” seleciona o provedor padrão; um id resolvível no registro envia para o provedor correspondente (observação: nem todos os provedores suportam format: "mp3")

Resposta:

Transmite blocos de áudio em tempo real
Retorna o cabeçalho X-Language-Code com o idioma detectado/usado
Content-Type: audio/mpeg (MP3) ou audio/wav (PCM)
Quando store é true, retorna o cabeçalho X-Tts-Id com o id sob o qual o registro de histórico será armazenado; a persistência é feita da melhor forma possível e é concluída logo após o término do streaming

Casos de uso:

Aplicações em tempo real que exigem reprodução imediata de áudio
Respostas de voz interativas
Cenários de text-to-speech de baixa latência

POST

api

llm

speech

tts

stream

Python (SDK)

from meetkai_mka1 import SDK


with SDK(
    bearer_auth="<YOUR_BEARER_TOKEN_HERE>",
) as sdk:

    res = sdk.llm.speech.speak_streaming(text="Hello, welcome to our text-to-speech service.", language="en", model="auto", store=False, format_="mp3")

    # Handle response
    print(res)

import { SDK } from "@meetkai/mka1";

const sdk = new SDK({
  bearerAuth: "<YOUR_BEARER_TOKEN_HERE>",
});

async function run() {
  const result = await sdk.llm.speech.speakStreaming({
    textToSpeechStreamingRequest: {
      text: "Hello, welcome to our text-to-speech service.",
      language: "en",
    },
  });

  console.log(result);
}

run();

using MeetKai.MKA1;
using MeetKai.MKA1.Types.Components;

var sdk = new SDK(bearerAuth: "<YOUR_BEARER_TOKEN_HERE>");

var res = await sdk.Llm.Speech.SpeakStreamingAsync(body: new MeetKai.MKA1.Types.Components.TextToSpeechStreamingRequest() {
    Text = "Hello, welcome to our text-to-speech service.",
    Language = TextToSpeechStreamingRequestLanguage.En,
});

// handle response

curl --request POST \
  --url https://apigw.mka1.com/api/v1/llm/speech/tts/stream \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "text": "Hello, welcome to our text-to-speech service.",
  "language": "en",
  "format": "mp3"
}
'

const options = {
  method: 'POST',
  headers: {Authorization: 'Bearer <token>', 'Content-Type': 'application/json'},
  body: JSON.stringify({
    text: 'Hello, welcome to our text-to-speech service.',
    language: 'en',
    format: 'mp3'
  })
};

fetch('https://apigw.mka1.com/api/v1/llm/speech/tts/stream', options)
  .then(res => res.json())
  .then(res => console.log(res))
  .catch(err => console.error(err));

<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://apigw.mka1.com/api/v1/llm/speech/tts/stream",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_ENCODING => "",
  CURLOPT_MAXREDIRS => 10,
  CURLOPT_TIMEOUT => 30,
  CURLOPT_HTTP_VERSION => CURL_HTTP_VERSION_1_1,
  CURLOPT_CUSTOMREQUEST => "POST",
  CURLOPT_POSTFIELDS => json_encode([
    'text' => 'Hello, welcome to our text-to-speech service.',
    'language' => 'en',
    'format' => 'mp3'
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: Bearer <token>",
    "Content-Type: application/json"
  ],
]);

$response = curl_exec($curl);
$err = curl_error($curl);

curl_close($curl);

if ($err) {
  echo "cURL Error #:" . $err;
} else {
  echo $response;
}

package main

import (
	"fmt"
	"strings"
	"net/http"
	"io"
)

func main() {

	url := "https://apigw.mka1.com/api/v1/llm/speech/tts/stream"

	payload := strings.NewReader("{\n  \"text\": \"Hello, welcome to our text-to-speech service.\",\n  \"language\": \"en\",\n  \"format\": \"mp3\"\n}")

	req, _ := http.NewRequest("POST", url, payload)

	req.Header.Add("Authorization", "Bearer <token>")
	req.Header.Add("Content-Type", "application/json")

	res, _ := http.DefaultClient.Do(req)

	defer res.Body.Close()
	body, _ := io.ReadAll(res.Body)

	fmt.Println(string(body))

}

HttpResponse<String> response = Unirest.post("https://apigw.mka1.com/api/v1/llm/speech/tts/stream")
  .header("Authorization", "Bearer <token>")
  .header("Content-Type", "application/json")
  .body("{\n  \"text\": \"Hello, welcome to our text-to-speech service.\",\n  \"language\": \"en\",\n  \"format\": \"mp3\"\n}")
  .asString();

require 'uri'
require 'net/http'

url = URI("https://apigw.mka1.com/api/v1/llm/speech/tts/stream")

http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true

request = Net::HTTP::Post.new(url)
request["Authorization"] = 'Bearer <token>'
request["Content-Type"] = 'application/json'
request.body = "{\n  \"text\": \"Hello, welcome to our text-to-speech service.\",\n  \"language\": \"en\",\n  \"format\": \"mp3\"\n}"

response = http.request(request)
puts response.read_body

"(binary)"

Autorizações

Authorization

string

header

obrigatório

Gateway auth: send Authorization: Bearer <mka1-api-key>. For multi-user server-side integrations, you can also send X-On-Behalf-Of: <external-user-id>.

Cabeçalhos

X-On-Behalf-Of

string

Optional external end-user identifier forwarded by the API gateway.

Corpo

application/json

Parâmetros de solicitação para conversão de texto para fala em streaming com seleção de idioma e opções de formato.

text

string

obrigatório

Texto de entrada para converter em fala

Minimum string length: 1

language

enum<string>

padrão:auto

Código da língua: 'auto' para detecção automática, ou códigos de língua ISO 639-1.

Opções disponíveis:

auto,

en,

zh,

hi,

es,

ar,

bn,

pt,

ru,

ja,

pa,

de,

ko,

fr,

tr,

it,

th,

pl,

nl,

id,

vi,

ur

model

string

padrão:auto

Identificador do modelo TTS. O padrão é 'auto', que seleciona o provedor padrão. IDs resolvíveis no registro são enviados para o provedor correspondente.

Exemplo:

"auto"

store

boolean

padrão:false

Quando verdadeiro, persista esta geração (texto de entrada, parâmetros e o áudio gerado) no histórico de texto para fala. O padrão é falso.

format

enum<string>

padrão:mp3

Formato de saída de áudio: 'mp3' para áudio MPEG (padrão) ou 'pcm' para PCM/WAV não compactado (24kHz, 16 bits, mono)

Opções disponíveis:

mp3,

pcm

Resposta

Streaming de áudio em formato MP3 ou PCM/WAV com cabeçalho de código de idioma.

MP3 audio stream (when format=mp3): 24kHz sample rate, 96 kbps bitrate, 16-bit, mono

Texto para fala

Gerar token de sala LiveKit

⌘I