企业 AI 成本管家

国产大模型网关

一个 OpenAI 兼容入口,统一管理多模型调用、项目预算、限流、调用日志与 BYOK 凭证。 只接入已备案的国产大模型,面向白名单企业试点,支持对公结算与可解释的用量账单。

三大维度 · 对标 Artificial Analysis

看完整可排序榜 →

智能(越高越优)、速度(越高越快)、成本(越低越省)三图一行排开(同 AA),各取该指标前 6 名;按供应商配色,海外参照叠斜纹并标「(参照)」——仅作对标、大陆不合规商用,不依赖颜色区分。第三张以可核验的每百万 token 混合价代 AA「每任务成本」(无每任务 token 数据,不编造),按价格从高到低、含海外参照(最贵的几乎都是海外)。完整 18 个模型见选型榜。数据来源 Artificial Analysis。

① 智能指数 ↑

加载中…

② 输出速度 ↑ (t/s)

③ 混合价 ↓ (¥/M)

已接入模型
国产已备案 + 海外参照
国产供应商
DeepSeek · 通义 · 智谱 · Kimi · 豆包 · MiniMax
接入协议2 套
OpenAI 兼容 + Anthropic 适配(Claude Code 可直连)
计费承诺原价透传
失败不计费 · 默认不存原文

模型与供应商数来自模型目录(Artificial Analysis 智能指数 + 各平台官方价目页)。本站无真实流量,故不展示用量 / 可用率数字。逐模型明细与可排序对比见选型榜

改 2 行,跑通已备案国产模型

已经在用 OpenAI SDK?只改 base_urlapi_key 两行,业务代码一行不动。

之前:直连 OpenAI
from openai import OpenAI

client = OpenAI(
    api_key="sk-...",
    base_url="https://api.openai.com/v1",
)
resp = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": "你好"}],
)
之后:弥聚网关 + 已备案国产模型
from openai import OpenAI

client = OpenAI(
    api_key="gk_live_你的网关Key",
    base_url="https://你的网关域名/v1",
)
resp = client.chat.completions.create(
    model="deepseek-chat",
    messages=[{"role": "user", "content": "你好"}],
)

Claude Code 用户走 /anthropic 三行环境变量直连 · 完整接入文档 →

三步接入,当天就能跑

① 换两行

申请试用拿 Gateway Key(gk_live_…),把 base_url + api_key 换成网关的——就这两行。

② 选已备案模型

modelqwen-flash / deepseek-chat 等已备案国产模型,业务代码不动。

③ 看可解释账单

控制台实时显示 token 拆分、上游原价、相对官方省了多少。

进客户控制台 →

合规优先

只接已备案,默认不存原文

仅路由已在网信办备案的国产模型,公示模型备案号,默认不存储 Prompt 与响应原文。

看信任中心 →

成本审计

某脱敏电商样例 省 58.2%

用你自己的真实流量跑影子评估,逐任务算出换已备案模型能省多少、质量掉不掉。~58% 为该脱敏样例,非"平均为客户省 58%"。

看审计样例 →

智能 × 价格选型

基于真实 benchmark 给模型替代与降本建议,把"换个模型省多少钱"算清楚。

看选型榜 →

国产模型,原价接入,今天就能跑