La API de MKA1 aplica límites de tasa en base a cada clave. Cada clave de API tiene su propia cuota configurada de manera independiente — solicitudes por segundo, minuto, hora o día. Cuando una clave supera su límite, la puerta de enlace devuelveDocumentation Index
Fetch the complete documentation index at: https://docs.mka1.com/llms.txt
Use this file to discover all available pages before exploring further.
429 Too Many Requests antes de que la solicitud llegue al modelo. No se consumen tokens ni se factura el uso.
Configuración de límites de tasa
Los límites de tasa se establecen por clave de API en el momento del aprovisionamiento. Las granularidades disponibles son:| Ventana | Ejemplo |
|---|---|
| Por segundo | 10 solicitudes/segundo |
| Por minuto | 60 solicitudes/minuto |
| Por hora | 1,000 solicitudes/hora |
| Por día | 10,000 solicitudes/día |
Demostración: limitación de tasa en acción
El siguiente ejemplo utiliza una clave de API real configurada con un límite de tasa de 1 solicitud por minuto. La primera solicitud tiene éxito, y la segunda — enviada inmediatamente después — es rechazada con HTTP 429.Solicitud 1 — exitosa
Solicitud 2 — limitada por tasa (enviada inmediatamente después)
Ejemplo programático
La respuesta 429
Cuando una solicitud es limitada por tasa, la puerta de enlace devuelve:| Campo | Valor |
|---|---|
| HTTP status | 429 Too Many Requests |
| Content-Type | application/json |
| Body | {"error": "Rate limit exceeded"} |
| Tokens consumidos | 0 — la solicitud nunca llega al modelo |
| Uso facturado | Ninguno |
OpenAI.RateLimitError con err.status === 429.
El SDK de MKA1 lanza un APIError con err.statusCode === 429.
Manejo de límites de tasa en tu aplicación
Cuando tu aplicación recibe una respuesta 429, reintenta con retroceso exponencial:Ver también
- Autenticación para la configuración de la clave de API y el patrón
X-On-Behalf-Of. - Autorización para control de acceso a nivel de recurso.
- Generar una respuesta para la estructura básica de solicitudes de Responses.