5 分钟接入,只改 2 行
已经在用 OpenAI SDK?改 base_url 和 api_key 两行,把请求指到本网关,直接跑已备案国产模型。业务代码一行不动。
之前:直连 OpenAI
from openai import OpenAI
client = OpenAI(
api_key="sk-...",
base_url="https://api.openai.com/v1",
)
resp = client.chat.completions.create(
model="gpt-4o-mini",
messages=[{"role": "user", "content": "你好"}],
)
print(resp.choices[0].message.content)
之后:本网关 + 国产模型(只改高亮两行)
from openai import OpenAI client = OpenAI( api_key="gk_live_你的网关Key", base_url="https://你的网关域名/v1", ) resp = client.chat.completions.create( model="qwen-flash", messages=[{"role": "user", "content": "你好"}], ) print(resp.choices[0].message.content)
或者用 curl 验证连接
curl
curl -s https://你的网关域名/v1/chat/completions \
-H "authorization: Bearer gk_live_你的网关Key" \
-H "content-type: application/json" \
-d '{"model":"qwen-flash","messages":[{"role":"user","content":"你好"}]}'
给调用打「用途」标签(看 token 花在哪)
想在控制台看到「token 花在调研 / 写代码 / 客服…哪类任务上」,给每次调用打一个 task_type 标签最准。两种方式任选(网关会记账分类,并在转发上游前剥掉该字段,不污染上游请求)。不打标签也行:网关会在内存中读取本次内容自动识别用途(粗略),识别后即丢弃、不持久化原文 —— 显式打标签始终覆盖自动识别,归因也更准:
方式 A:请求体字段 task_type
curl -s https://你的网关域名/v1/chat/completions \
-H "authorization: Bearer gk_live_你的网关Key" \
-H "content-type: application/json" \
-d '{"model":"deepseek-chat","task_type":"写代码","messages":[{"role":"user","content":"写一个快排"}]}'
方式 B:请求头 x-task-type(不改 body,SDK 友好)
curl -s https://你的网关域名/v1/chat/completions \
-H "authorization: Bearer gk_live_你的网关Key" \
-H "content-type: application/json" \
-H "x-task-type: 调研" \
-d '{"model":"deepseek-chat","messages":[{"role":"user","content":"调研一下国产向量库"}]}'
不打标签的调用归入 unspecified。控制台「用量明细」会按 task_type 和模型分别拆出请求数、输入/输出 token、成本与占比。
用 Claude Code 驱动国产模型(Anthropic 协议适配已上线)
网关内置 Anthropic Messages 适配,Claude Code / Anthropic SDK 也能直连已备案国产模型,流式输出正常。三行环境变量即可,无需改 Claude Code 本身:
Claude Code · 三行环境变量
export ANTHROPIC_BASE_URL="https://你的网关域名/anthropic" export ANTHROPIC_AUTH_TOKEN="gk_live_你的网关Key" export ANTHROPIC_MODEL="deepseek-chat" # 已备案国产模型;留空则自动用项目默认模型 claude
原理:网关把 Anthropic 的 /v1/messages 请求(含 SSE 流式)实时翻译成上游 OpenAI 协议再转回,计费按上游原价透传、失败不计费。ANTHROPIC_MODEL 留空时,Claude Code 默认发的 claude-* 模型名会自动落到你项目的默认国产模型。
三步走
- 申请试用拿到 Gateway Key(
gk_live_…),控制台可看实时用量。 - 把
base_url指到本网关、api_key换成 Gateway Key——就这两行。 model选已备案国产模型(如qwen-flash、deepseek-chat);每次调用在控制台实时显示 token 拆分、上游原价、相对官方省了多少。
占位 Key(gk_live_你的网关Key)与 你的网关域名 均为示例,非真实可用凭证;开通后在控制台获取你的专属值。Claude Code 已可直连(见上)。还想了解更多?看 信任中心(为什么敢公示备案号)和 价格对比(改之前先算账)。