': {'code': '', 'message': '[sk-zoj***Vj8] Token amount has been exhausted token...
🚨 错误信息
🤖 AI解决方案
报错分析报告
1. 错误翻译
原文:Token amount has been exhausted token.RemainQuota = 0
译文:令牌额度已耗尽,剩余配额为0
2. 原因分析
根本原因:API调用配额已用完,无法继续访问VLLM/bge-reranker-v2-m3-free模型。
具体分析:
3. 解决方案
立即解决方案:
- 检查API密钥:
sk-zoj*Vj8- 申请增加配额或升级服务套餐
python
如果使用Python调用,添加错误处理机制
import requests
from typing import Optionaldef call_reranker_api(text: str, api_key: str) -> Optional[dict]:
"""
调用重排序API,包含错误处理
"""
url = "https://api.your-provider.com/v1/rerank"
headers = {
"Authorization": f"Bearer {api_key}",
"Content-Type": "application/json"
}
data = {
"model": "VLLM/bge-reranker-v2-m3-free",
"text": text
}
try:
response = requests.post(url, json=data, headers=headers, timeout=30)
response.raise_for_status()
return response.json()
except requests.exceptions.HTTPError as e:
if response.status_code == 401:
print("❌ API配额已耗尽,请检查剩余额度或联系服务商")
# 这里可以添加备用模型调用逻辑
else:
print(f"❌ API调用失败: {e}")
return None
except Exception as e:
print(f"❌ 未知错误: {e}")
return None
4.️ 预防措施
最佳实践建议:
python
# 定期检查API配额使用情况
def check_quota_usage(api_key: str):
# 实现配额查询逻辑
# 设置使用阈值(如80%),提前预警
pass
- 配置备用模型或本地模型作为备选方案
- 实现缓存机制,减少不必要的API调用
- 使用批处理优化,减少API调用次数
工具推荐:
---
重要提醒:请及时联系您的API服务提供商(DMXAPI平台)处理配额问题,避免影响业务正常运行。