DeepSeek、通义、文心、智谱、Kimi、豆包、星火、混元、MiniMax、阶跃、Yi、商汤……以及私有部署的 Qwen / Llama 系列开源模型。同一个 API,同一份计费,即时切换。
按 Token 调云端 API、按小时租独占算力、按需把模型放进你机房、按数据集做行业微调。四种形态,同一份控制台。
商业模型直连官方计费,1:1 原价。开源模型由我们托管运行,价格更低、可私有化。
已有 OpenAI 代码无需改造。只换 base_url,即可访问全部国产模型。
1# 只换 base_url,即可调用 50+ 国产模型
2from openai import OpenAI
3
4client = OpenAI(
5 base_url="https://api.wangenyun.com/v1",
6 api_key="sk-wgy-************",
7)
8
9resp = client.chat.completions.create(
10 model="deepseek-v3",
11 messages=[
12 {"role": "system", "content": "你是有用的助手"},
13 {"role": "user", "content": "介绍一下万根云"},
14 ],
15 stream=True,
16)
17for chunk in resp:
18 print(chunk.choices[0].delta.content, end="")
万根公有云推理集群。OpenAI 协议,按量付费,最快接入。适合 ToC、SaaS 应用。
独立 GPU 资源池,流量隔离,高并发不抢占。带 99.99% SLA,可自选模型组合。
整机柜交付至您机房。模型权重 + 推理框架 + 运维平台一站式给到。数据完全自控。
核心区别在三个层面:(1) 接入成本:50+ 模型只需 1 个 Key,统一 OpenAI 协议;(2) 计费与配额:一张账单覆盖所有模型,可按团队/项目分账;(3) 工程稳定性:智能路由、限速、降级、语义缓存全部内建,主流模型故障时自动 fallback。计费上原价 1:1 直通,网关本身不加成。
可以。在控制台注册你的私有模型端点(支持 vLLM / Ollama / SGLang),万根网关会把它当成一个新的 model name 暴露出来。你的代码不变,只把 model 参数换成自定义名字即可。请求会被路由到你指定的私有节点,不会走公网。
每次请求的 prompt 会被嵌入向量化,与历史请求做相似度匹配。命中阈值时直接返回缓存答案,跳过模型调用。可以按 API Key / 项目 / 模型粒度隔离缓存,也可以关闭。线上客户平均节省 38% Token 成本,P95 延迟 < 100ms。
万根云通过 ISO 27001、等保 2.0 三级、可信云增强等认证。API 调用日志默认 30 天滚动,客户可在控制台开启关闭。私有化部署版本支持完整的离线运行,模型权重与日志均不出域,适合金融、政企客户。
不需要改代码。只需在请求体里把 model: "deepseek-v3" 换成 model: "qwen3-max" 即可。如果开启了智能路由,你甚至可以传 model: "auto",系统按任务类型、延迟、成本自动选择。
商业模型(DeepSeek-V3、通义、文心等)直连官方,延迟低、效果稳;开源模型由万根托管运行,价格更低,且可以申请权重做私有化、微调。一般建议:正式产品用商业 API,研发/测试或对成本敏感场景用开源镜像。两者都支持平滑切换。