首页/AI 大模型
50+ 国产 / 开源大模型 · 一行 API 调用

国产大模型
装进你的产品。

DeepSeek、通义、文心、智谱、Kimi、豆包、星火、混元、MiniMax、阶跃、Yi、商汤……以及私有部署的 Qwen / Llama 系列开源模型。同一个 API,同一份计费,即时切换。

50+
国产 / 开源大模型
¥0.001/K
起步价(DeepSeek-V3)
1MToken
最长上下文
OpenAI
协议完全兼容
四种使用方式

从一行 API,
到一柜机器。

按 Token 调云端 API、按小时租独占算力、按需把模型放进你机房、按数据集做行业微调。四种形态,同一份控制台。

算力租赁

独占 GPU,按小时计费。适合训练、批量推理。

  • H800 / H100 / A100 / L40s
  • 分钟级开机,秒级伸缩
  • 裸金属 / 虚拟化两种形态
查看规格 →

私有化部署

整机柜交付,数据不出域。金融 / 政企首选。

  • 本地运行,断网可用
  • 等保 2.0 / 信创 兼容
  • 含运维与升级服务
联系架构师 →

模型微调

行业语料 + LoRA / 全参数微调。沉淀私有知识。

  • 数据上传 → 训练 → 部署
  • 支持 SFT / DPO / RLHF
  • 训完直接接入 API
查看流程 →
50+ 国产与开源模型

主流模型,
按厂商分组。

商业模型直连官方计费,1:1 原价。开源模型由我们托管运行,价格更低、可私有化。

深度求索 DeepSeek国产开源旗舰 · 性价比与推理
deepseek-v3
综合旗舰,对标 GPT-4o,价格 1/10
¥0.001/¥0.002128K
deepseek-r1
深度推理思考链,对标 o1
¥0.004/¥0.016128K
deepseek-coder-v2
代码专用模型,代码补全与重构
¥0.001/¥0.002128K
deepseek-vl2
视觉多模态,看图问答
¥0.002/¥0.005128K
阿里通义 Qwen中文场景成熟 · 长上下文之王
qwen3-max
通义千问 3 旗舰版
¥0.008/¥0.024128K
qwen3-long
百万 Token 上下文
¥0.0005/¥0.0021M
qwen-vl-max
视觉多模态旗舰
¥0.008/¥0.02432K
qwen2.5-coder
代码专用,32B / 7B 多规格
¥0.002/¥0.006128K
百度文心 ERNIE中文理解 · 工具调用稳定
ernie-4.5-turbo
文心 4.5 涡轮版
¥0.004/¥0.016128K
ernie-4.5
完整版,工具调用更稳
¥0.012/¥0.030128K
ernie-tiny
轻量版,高并发场景
¥0.0003/¥0.000632K
ernie-vilg-3
文心一格 · 文生图
¥0.30/张1024px
智谱 GLM清华系 · 长文本与代码均衡
glm-4.6
智谱清言旗舰
¥0.005/¥0.015128K
glm-4-air
空气版,极低延迟
¥0.001/¥0.001128K
glm-4-plus
推理增强版
¥0.025/¥0.05128K
cogview-3
文生图,中文优化
¥0.25/张1024px
Moonshot Kimi · 字节豆包 · 其他长文本 · 高并发 · 多元生态
kimi-k2
月之暗面,200K 长上下文
¥0.012/¥0.036200K
doubao-1.5-pro
字节豆包,高并发首选
¥0.0008/¥0.002256K
spark-v4
讯飞星火,语音强项
¥0.005/¥0.018128K
hunyuan-large
腾讯混元,生态深
¥0.012/¥0.012256K
abab7-chat
MiniMax,角色扮演见长
¥0.008/¥0.025256K
step-2
阶跃星辰,万亿参数
¥0.038/¥0.12032K
sensechat-5.5
商汤日日新
¥0.040/¥0.100128K
yi-large
零一万物
¥0.020/¥0.02032K
开源模型(万根托管)价格更低 · 支持私有化部署 · 微调自由
qwen2.5-72b-open
Qwen 开源版,72B 参数
¥0.001/¥0.002开源
llama3.3-70b-cn
Llama 中文优化
¥0.001/¥0.002开源
deepseek-v3-open
DeepSeek 开源镜像
¥0.0008/¥0.001开源
internlm-2.5
上海AI实验室书生
¥0.001/¥0.002开源
一行代码接入

OpenAI 协议完全兼容

已有 OpenAI 代码无需改造。只换 base_url,即可访问全部国产模型。

~/quickstart.py · Python
1# 只换 base_url,即可调用 50+ 国产模型
2from openai import OpenAI
3
4client = OpenAI(
5    base_url="https://api.wangenyun.com/v1",
6    api_key="sk-wgy-************",
7)
8
9resp = client.chat.completions.create(
10    model="deepseek-v3",
11    messages=[
12        {"role": "system", "content": "你是有用的助手"},
13        {"role": "user", "content": "介绍一下万根云"},
14    ],
15    stream=True,
16)
17for chunk in resp:
18    print(chunk.choices[0].delta.content, end="")

不止 Python

Node.js openai → ChatCompletion.create({ model: 'deepseek-v3', ... })
Go go-openai → ChatCompletion(ctx, req)
cURL curl -H "Authorization: Bearer sk-wgy-…" /v1/chat/completions
LangChain ChatOpenAI(base_url=…, model='qwen3-max')
Dify 模型供应商 → OpenAI-API-compatible → 填 base_url

兼容协议覆盖

chat/completions completions embeddings images/generations audio/transcriptions tools / function-calling vision · multi-modal
数据不出域

三种部署形态,
覆盖企业 99% 场景。

// 公有云

API 直连

万根公有云推理集群。OpenAI 协议,按量付费,最快接入。适合 ToC、SaaS 应用。

延迟
P95 < 500ms
起步
¥0.001/K
SLA
99.95%
部署
5 分钟
// 专享集群

独占算力

独立 GPU 资源池,流量隔离,高并发不抢占。带 99.99% SLA,可自选模型组合。

GPU
H800 / H100 起
起步
¥18K / 月
SLA
99.99%
部署
3 工作日
// 私有化

本地部署

整机柜交付至您机房。模型权重 + 推理框架 + 运维平台一站式给到。数据完全自控。

规格
8U / 16U / 整柜
起步
¥180K / 套
合规
等保 / 信创
部署
10 工作日
FAQ

常见问题

万根云的 AI 服务和直接对接厂商 API,有什么区别?

核心区别在三个层面:(1) 接入成本:50+ 模型只需 1 个 Key,统一 OpenAI 协议;(2) 计费与配额:一张账单覆盖所有模型,可按团队/项目分账;(3) 工程稳定性:智能路由、限速、降级、语义缓存全部内建,主流模型故障时自动 fallback。计费上原价 1:1 直通,网关本身不加成。

调用本地 / 私有部署模型,可以走同一个 API 吗?

可以。在控制台注册你的私有模型端点(支持 vLLM / Ollama / SGLang),万根网关会把它当成一个新的 model name 暴露出来。你的代码不变,只把 model 参数换成自定义名字即可。请求会被路由到你指定的私有节点,不会走公网。

语义缓存是怎么工作的?

每次请求的 prompt 会被嵌入向量化,与历史请求做相似度匹配。命中阈值时直接返回缓存答案,跳过模型调用。可以按 API Key / 项目 / 模型粒度隔离缓存,也可以关闭。线上客户平均节省 38% Token 成本,P95 延迟 < 100ms。

数据安全和合规情况?

万根云通过 ISO 27001、等保 2.0 三级、可信云增强等认证。API 调用日志默认 30 天滚动,客户可在控制台开启关闭。私有化部署版本支持完整的离线运行,模型权重与日志均不出域,适合金融、政企客户。

如何切换模型?需要改代码吗?

不需要改代码。只需在请求体里把 model: "deepseek-v3" 换成 model: "qwen3-max" 即可。如果开启了智能路由,你甚至可以传 model: "auto",系统按任务类型、延迟、成本自动选择。

开源模型和商业模型怎么选?

商业模型(DeepSeek-V3、通义、文心等)直连官方,延迟低、效果稳;开源模型由万根托管运行,价格更低,且可以申请权重做私有化、微调。一般建议:正式产品用商业 API,研发/测试或对成本敏感场景用开源镜像。两者都支持平滑切换。

立即开始

注册即送 1000 万 Token
所有国产模型通用。

免费开通 先去造梦场玩