① 换两行
申请试用拿 Gateway Key(gk_live_…),把 base_url + api_key 换成网关的——就这两行。
智能(越高越优)、速度(越高越快)、成本(越低越省)三图一行排开(同 AA),各取该指标前 6 名;按供应商配色,海外参照叠斜纹并标「(参照)」——仅作对标、大陆不合规商用,不依赖颜色区分。第三张以可核验的每百万 token 混合价代 AA「每任务成本」(无每任务 token 数据,不编造),按价格从高到低、含海外参照(最贵的几乎都是海外)。完整 18 个模型见选型榜。数据来源 Artificial Analysis。
加载中…
模型与供应商数来自模型目录(Artificial Analysis 智能指数 + 各平台官方价目页)。本站无真实流量,故不展示用量 / 可用率数字。逐模型明细与可排序对比见选型榜。
已经在用 OpenAI SDK?只改 base_url 和 api_key 两行,业务代码一行不动。
from openai import OpenAI
client = OpenAI(
api_key="sk-...",
base_url="https://api.openai.com/v1",
)
resp = client.chat.completions.create(
model="gpt-4o-mini",
messages=[{"role": "user", "content": "你好"}],
)
from openai import OpenAI client = OpenAI( api_key="gk_live_你的网关Key", base_url="https://你的网关域名/v1", ) resp = client.chat.completions.create( model="deepseek-chat", messages=[{"role": "user", "content": "你好"}], )
Claude Code 用户走 /anthropic 三行环境变量直连 · 完整接入文档 →
申请试用拿 Gateway Key(gk_live_…),把 base_url + api_key 换成网关的——就这两行。
model 选 qwen-flash / deepseek-chat 等已备案国产模型,业务代码不动。
控制台实时显示 token 拆分、上游原价、相对官方省了多少。
仅路由已在网信办备案的国产模型,公示模型备案号,默认不存储 Prompt 与响应原文。
用你自己的真实流量跑影子评估,逐任务算出换已备案模型能省多少、质量掉不掉。~58% 为该脱敏样例,非"平均为客户省 58%"。
基于真实 benchmark 给模型替代与降本建议,把"换个模型省多少钱"算清楚。
已经在用 OpenAI SDK?改 base_url 和 api_key 两行,业务代码不动,直接跑已备案国产模型。
不用先招会用 AI 的人,先把账算清:看一份脱敏的成本审计样例,「换个模型省多少钱」一眼看懂。