API Latency Test

OpenAI 兼容接口质量检测

中转站掺水检测

输入接口地址和 API Key,可选常用模型或获取模型列表后检测。

我们不会保存你的 API Key。它只用于本次实时请求,不写入账号系统、榜单库或托管功能,建议使用小额度测试 Key。

不需要注册。API Key 只用于本次实时检测。

常见问题

什么是中转站掺水检测?

不是简单测接口通不通,而是把模型列表、响应结构、流式输出、延迟和固定题库一起看,帮你快速判断中转站是否真实、稳定、可用。

为什么不能只看价格和模型名称?

价格低不代表线路稳,模型名好看也不代表能力一致。我们会同时看协议、题库、流式和最慢请求,比只看宣传页更有参考价值。

我们主要检测哪些专业指标?

覆盖模型列表、模型存在、协议结构、QA 题库、流式质量和延迟表现,对应真实接入里最常见的 SDK 报错、超时和能力不匹配问题。

什么是 OpenAI 兼容协议,为什么它很重要?

很多 AI 应用和 SDK 默认按 OpenAI 风格接入。如果字段、错误格式或流式分片不标准,后续就容易调试成本高、线上偶发失败。

流式输出为什么要单独检测?

聊天、客服、写作和 Agent 都依赖首 Token 与连续分片。普通请求能返回,不代表流式体验稳定,所以必须单独看。

延迟、首 Token、流式总耗时和 Tokens 是什么意思?

延迟是普通请求从发出到拿到首个响应的时间,越短越快。首 Token 是流式返回里第一个字或片段出现的时间,也叫 TTFT,越短越适合聊天和实时输出。流式总耗时是这次流式完整结束一共花了多久。Tokens/秒是模型输出速度,数字越大代表吐字越快。输入 Tokens 是这次请求里你发给模型的内容被拆成了多少 token,输出 Tokens 是模型这次实际返回了多少 token。

题库检测能看出什么问题?

固定题库会观察指令跟随、结构化输出和基础知识表现,能暴露模型能力不匹配、返回被加工、回答不稳定等风险。

延迟分数为什么很关键?

真实业务怕的不是偶尔很快,而是最慢请求拖后腿。我们会把响应延迟、流式首包和 QA 最慢耗时一起纳入判断。

API Key 会被保存吗?

不会。API Key 只用于本次实时检测,不写入账号系统、不进入榜单库,也不提供托管密钥功能。建议使用小额度测试 Key,不要直接使用高权限主 Key。

检测结果适合用在购买前决策吗?

适合做充值前初筛。它能帮你快速排除明显异常的线路,但不等于长期压测、SLA 监控或多地域稳定性证明。

为什么同一个模型多测几次分数会不一样?

中转站可能按负载、成本和可用性切换上游或线路。多测几次看趋势,比只看单次跑分更可靠。

检测结果能证明中转站绝对安全吗?

不能。它更像技术体检,重点发现接口异常、性能偏差和兼容性风险。建议先检测,再小额试用,最后看长期稳定性。

这个评分到底是怎么来的?

当前评分主要来自四类信号:知识问答通过率、模型与目标是否匹配、OpenAI 协议与响应结构是否正常、以及流式和延迟是否过关。它是单次快检分,不是统计学意义上的长期质量分。