常见问题
收集了用户问得最多的问题。如未涵盖你的情况,请加官方 QQ 群反馈。
计费 & 余额
本站如何收费?
按各家官方倍率打折后的实际 token 用量计费,不收订阅费/月费。每次调用的 input / output token、模型、实际费用均可在控制台 → 日志查看。
充值后如何查看余额?
控制台首页顶部即显示当前剩余额度(单位:美元等价)。
支持发票吗?
暂不支持开发票。如有此需求请加群联系。
充值是否支持退款?
除明显的服务故障外不支持退款,请按需充值。
API Key & 令牌
令牌可以创建多个吗?
可以。建议为不同业务或环境分别创建独立令牌(例如 app-prod、app-dev),便于分别监控用量与隔离风险。
令牌额度怎么设?
令牌额度 0 表示不限(受账户余额约束)。如担心代码 bug 失控调用,可给单令牌设上限。
令牌泄漏怎么办?
立即在控制台 → 令牌删除该令牌,余额仍在账户中,重建一个新令牌即可。
模型选型
如何选择适合的模型?
- 日常对话 / 编程辅助:
gpt-4o-mini、claude-3-5-haiku、deepseek-chat(性价比高) - 复杂推理 / 长文档:
gpt-4o、claude-sonnet-4-5、gemini-1.5-pro - 数学 / 推理 / 长链思考:
o1、deepseek-reasoner、gemini-2.0-flash-thinking-exp - 多模态(图):
gpt-4o、claude-sonnet-4-5、gemini-2.0-flash
每个模型的上下文窗口?
遵循各家官方限制(GPT 系列 128K、Claude 200K、Gemini 1M、DeepSeek 64K 等)。具体见 模型列表。
性能 & 限流
是否有并发限制?
每令牌默认 100 并发,总账户级别根据上游配额动态调度。如有更高需求请联系客服调整。
调用偶发超时怎么办?
- 请将客户端 HTTP timeout 调到至少 60s(reasoning 类模型建议 180s)
- 对幂等场景加自动重试(指数退避,最多 3 次)
- 非关键路径可加模型降级(如 4o 失败回退 4o-mini)
速度比官方慢吗?
本站位于国内主机房,从中国大陆访问速度通常 快于直连官方接口(绕道海外 + 防火墙问题)。海外访问可能略慢于官方。
开发常见错误
401 invalid_api_key
检查:1) Authorization header 拼写;2) 令牌是否被禁用或删除;3) 是否在 Header 里包含了 Bearer 前缀。
404 model_not_found
模型名拼错或该模型已下线。访问 主站 → 模型广场查最新可用名。
402 insufficient_quota
账户余额或令牌额度耗尽。前往充值或在令牌设置里调高上限。
429 rate_limit_exceeded
触发限流。降低并发,或加客户端指数退避重试逻辑。
其他
是否提供 Embedding / TTS / Whisper?
支持。OpenAI 系全部支持(text-embedding-3-*、tts-1、whisper-1),调用方式与 OpenAI 官方完全一致。
是否支持图像生成(DALL-E / Midjourney)?
支持 dall-e-3、gpt-image-1、doubao-seedream-4-0 等。Midjourney 需通过专门接入,请加群咨询。
数据是否被记录或用于训练?
本站仅记录调用日志(请求时间、模型、token 用量),不存储 messages 内容。上游各家的隐私策略以其官方为准。