Saltar al contenido principal
GET
/
api
/
v1
/
llm
/
speech
/
transcriptions
/
history
/
{stt_id}
Python (SDK)
from meetkai_mka1 import SDK


with SDK(
    bearer_auth="<YOUR_BEARER_TOKEN_HERE>",
) as sdk:

    res = sdk.llm.speech.get_transcription_history(stt_id="stt_aa87e2b1112a455b8deabed784372198")

    # Handle response
    print(res)
{
  "id": "stt_aa87e2b1112a455b8deabed784372198",
  "object": "speech.transcription",
  "text": "Hello, this is a sample transcription of the audio file.",
  "language": "en",
  "confidence": 0.95,
  "model": "auto",
  "provider_id": "azure",
  "filename": "audio.wav",
  "audio_bytes": 120000,
  "audio_mime_type": "audio/wav",
  "speakers": null,
  "streaming": false,
  "metadata": {},
  "created_at": 1704067200
}

Autorizaciones

Authorization
string
header
requerido

Gateway auth: send Authorization: Bearer <mka1-api-key>. For multi-user server-side integrations, you can also send X-On-Behalf-Of: <external-user-id>.

Encabezados

X-On-Behalf-Of
string

Optional external end-user identifier forwarded by the API gateway.

Parámetros de ruta

stt_id
string
requerido

Respuesta

200 - application/json

Está bien

Una transcripción de voz a texto almacenada.

id
string
requerido

Identificador único para el elemento de historial.

object
any
requerido

El tipo de objeto, siempre 'speech.transcription'.

text
string
requerido

El texto transcrito.

language
string | null
requerido

El código de idioma detectado o especificado.

confidence
number | null
requerido

Puntuación de confianza de 0 a 1, cuando esté disponible.

model
string
requerido

El modelo de transcripción utilizado.

provider_id
string | null
requerido

El proveedor que produjo la transcripción.

filename
string | null
requerido

Nombre de archivo original del audio de entrada, cuando esté disponible.

audio_bytes
integer
requerido

Tamaño del audio de entrada en bytes.

Rango requerido: -9007199254740991 <= x <= 9007199254740991
audio_mime_type
string | null
requerido

Tipo MIME del audio de entrada almacenado.

speakers
object[] | null
requerido

Segmentos de diarización de hablantes, cuando están presentes.

streaming
boolean
requerido

Si la transcripción provino del WebSocket de streaming.

metadata
object
requerido

Metadatos arbitrarios almacenados con el artículo.

created_at
integer
requerido

Marca de tiempo Unix (segundos) cuando se creó el elemento.

Rango requerido: -9007199254740991 <= x <= 9007199254740991