429 Too Many Requests antes que a requisição chegue ao modelo. Nenhum token é consumido e nenhum uso é cobrado.
Configuração de limites de taxa
Os limites de taxa são definidos por chave de API no momento do provisionamento. As granularidades disponíveis são:| Janela | Exemplo |
|---|---|
| Por segundo | 10 requisições/segundo |
| Por minuto | 60 requisições/minuto |
| Por hora | 1.000 requisições/hora |
| Por dia | 10.000 requisições/dia |
Demonstração: limitação de taxa em ação
O exemplo a seguir usa uma chave de API real configurada com limite de taxa de 1 requisição por minuto. A primeira requisição é bem-sucedida, e a segunda — enviada imediatamente após — é rejeitada com HTTP 429.Requisição 1 — bem-sucedida
Requisição 2 — limitada por taxa (enviada imediatamente após)
Exemplo programático
A resposta 429
Quando uma requisição é limitada por taxa, o gateway retorna:| Campo | Valor |
|---|---|
| Status HTTP | 429 Too Many Requests |
| Content-Type | application/json |
| Corpo | {"error": "Rate limit exceeded"} |
| Tokens consumidos | 0 — a requisição nunca chega ao modelo |
| Uso cobrado | Nenhum |
OpenAI.RateLimitError com err.status === 429.
O MKA1 SDK lança APIError com err.statusCode === 429.
Tratando limites de taxa na sua aplicação
Quando sua aplicação receber uma resposta 429, faça retentativa com backoff exponencial:Veja também
- Autenticação para configuração de chaves de API e o padrão
X-On-Behalf-Of. - Autorização para controle de acesso em nível de recurso.
- Gerar uma resposta para o formato base de requisição Responses.