5 分钟接入,只改 2 行

已经在用 OpenAI SDK?改 base_url 和 api_key 两行,把请求指到本网关,直接跑已备案国产模型。业务代码一行不动。

之前:直连 OpenAI

from openai import OpenAI

client = OpenAI(
    api_key="sk-...",
    base_url="https://api.openai.com/v1",
)

resp = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": "你好"}],
)
print(resp.choices[0].message.content)

之后:本网关 + 国产模型(只改高亮两行)

from openai import OpenAI

client = OpenAI(
    api_key="gk_live_你的网关Key",
    base_url="https://你的网关域名/v1",
)

resp = client.chat.completions.create(
    model="qwen-flash",
    messages=[{"role": "user", "content": "你好"}],
)
print(resp.choices[0].message.content)

或者用 curl 验证连接

curl

curl -s https://你的网关域名/v1/chat/completions \
  -H "authorization: Bearer gk_live_你的网关Key" \
  -H "content-type: application/json" \
  -d '{"model":"qwen-flash","messages":[{"role":"user","content":"你好"}]}'

给调用打「用途」标签(看 token 花在哪)

想在控制台看到「token 花在调研 / 写代码 / 客服…哪类任务上」,给每次调用打一个 task_type 标签最准。两种方式任选(网关会记账分类,并在转发上游前剥掉该字段,不污染上游请求)。不打标签也行:网关会在内存中读取本次内容自动识别用途(粗略),识别后即丢弃、不持久化原文 —— 显式打标签始终覆盖自动识别,归因也更准:

方式 A:请求体字段 task_type

curl -s https://你的网关域名/v1/chat/completions \
  -H "authorization: Bearer gk_live_你的网关Key" \
  -H "content-type: application/json" \
  -d '{"model":"deepseek-chat","task_type":"写代码","messages":[{"role":"user","content":"写一个快排"}]}'

方式 B:请求头 x-task-type(不改 body,SDK 友好)

curl -s https://你的网关域名/v1/chat/completions \
  -H "authorization: Bearer gk_live_你的网关Key" \
  -H "content-type: application/json" \
  -H "x-task-type: 调研" \
  -d '{"model":"deepseek-chat","messages":[{"role":"user","content":"调研一下国产向量库"}]}'

不打标签的调用归入 unspecified。控制台「用量明细」会按 task_type 和模型分别拆出请求数、输入/输出 token、成本与占比。

用 Claude Code 驱动国产模型(Anthropic 协议适配已上线)

网关内置 Anthropic Messages 适配,Claude Code / Anthropic SDK 也能直连已备案国产模型,流式输出正常。三行环境变量即可,无需改 Claude Code 本身:

Claude Code · 三行环境变量

export ANTHROPIC_BASE_URL="https://你的网关域名/anthropic"
export ANTHROPIC_AUTH_TOKEN="gk_live_你的网关Key"
export ANTHROPIC_MODEL="deepseek-chat"   # 已备案国产模型;留空则自动用项目默认模型
claude

原理:网关把 Anthropic 的 /v1/messages 请求(含 SSE 流式)实时翻译成上游 OpenAI 协议再转回,计费按上游原价透传、失败不计费。ANTHROPIC_MODEL 留空时,Claude Code 默认发的 claude-* 模型名会自动落到你项目的默认国产模型。

三步走

申请试用拿到 Gateway Key(gk_live_…),控制台可看实时用量。
把 base_url 指到本网关、api_key 换成 Gateway Key——就这两行。
model 选已备案国产模型(如 qwen-flash、deepseek-chat);每次调用在控制台实时显示 token 拆分、上游原价、相对官方省了多少。

占位 Key(gk_live_你的网关Key)与 你的网关域名 均为示例,非真实可用凭证;开通后在控制台获取你的专属值。Claude Code 已可直连(见上)。还想了解更多?看信任中心(为什么敢公示备案号)和价格对比(改之前先算账)。

接入后看实时用量 / 账单 →