首页/AI 大模型

50+ 国产 / 开源大模型 · 一行 API 调用

把国产大模型
装进你的产品。

DeepSeek、通义、文心、智谱、Kimi、豆包、星火、混元、MiniMax、阶跃、Yi、商汤……以及私有部署的 Qwen / Llama 系列开源模型。同一个 API,同一份计费,即时切换。

免费开通 · 1000 万 Token 先去造梦场玩

50+

国产 / 开源大模型

¥0.001/K

起步价(DeepSeek-V3)

1MToken

最长上下文

OpenAI

协议完全兼容

四种使用方式

从一行 API,
到一柜机器。

按 Token 调云端 API、按小时租独占算力、按需把模型放进你机房、按数据集做行业微调。四种形态,同一份控制台。

主推

Token 调用

OpenAI 兼容 API,按用量计费。最快的接入方式。

新用户送 1000 万 Token
50+ 模型自由切换
语义缓存平均省 38%

查看接入 →

算力租赁

独占 GPU,按小时计费。适合训练、批量推理。

H800 / H100 / A100 / L40s
分钟级开机,秒级伸缩
裸金属 / 虚拟化两种形态

查看规格 →

私有化部署

整机柜交付,数据不出域。金融 / 政企首选。

本地运行,断网可用
等保 2.0 / 信创兼容
含运维与升级服务

联系架构师 →

模型微调

行业语料 + LoRA / 全参数微调。沉淀私有知识。

数据上传 → 训练 → 部署
支持 SFT / DPO / RLHF
训完直接接入 API

查看流程 →

50+ 国产与开源模型

主流模型,
按厂商分组。

商业模型直连官方计费,1:1 原价。开源模型由我们托管运行,价格更低、可私有化。

深度求索 DeepSeek国产开源旗舰 · 性价比与推理

deepseek-v3

综合旗舰,对标 GPT-4o,价格 1/10

¥0.001/¥0.002128K

deepseek-r1

深度推理思考链,对标 o1

¥0.004/¥0.016128K

deepseek-coder-v2

代码专用模型,代码补全与重构

¥0.001/¥0.002128K

deepseek-vl2

视觉多模态,看图问答

¥0.002/¥0.005128K

通

阿里通义 Qwen中文场景成熟 · 长上下文之王

qwen3-max

通义千问 3 旗舰版

¥0.008/¥0.024128K

qwen3-long

百万 Token 上下文

¥0.0005/¥0.0021M

qwen-vl-max

视觉多模态旗舰

¥0.008/¥0.02432K

qwen2.5-coder

代码专用,32B / 7B 多规格

¥0.002/¥0.006128K

文

百度文心 ERNIE中文理解 · 工具调用稳定

ernie-4.5-turbo

文心 4.5 涡轮版

¥0.004/¥0.016128K

ernie-4.5

完整版,工具调用更稳

¥0.012/¥0.030128K

ernie-tiny

轻量版,高并发场景

¥0.0003/¥0.000632K

ernie-vilg-3

文心一格 · 文生图

¥0.30/张1024px

智

智谱 GLM清华系 · 长文本与代码均衡

glm-4.6

智谱清言旗舰

¥0.005/¥0.015128K

glm-4-air

空气版,极低延迟

¥0.001/¥0.001128K

glm-4-plus

推理增强版

¥0.025/¥0.05128K

cogview-3

文生图,中文优化

¥0.25/张1024px

Moonshot Kimi · 字节豆包 · 其他长文本 · 高并发 · 多元生态

kimi-k2

月之暗面,200K 长上下文

¥0.012/¥0.036200K

doubao-1.5-pro

字节豆包,高并发首选

¥0.0008/¥0.002256K

spark-v4

讯飞星火,语音强项

¥0.005/¥0.018128K

hunyuan-large

腾讯混元,生态深

¥0.012/¥0.012256K

abab7-chat

MiniMax,角色扮演见长

¥0.008/¥0.025256K

step-2

阶跃星辰,万亿参数

¥0.038/¥0.12032K

sensechat-5.5

商汤日日新

¥0.040/¥0.100128K

yi-large

零一万物

¥0.020/¥0.02032K

开源模型(万根托管)价格更低 · 支持私有化部署 · 微调自由

qwen2.5-72b-open

Qwen 开源版,72B 参数

¥0.001/¥0.002开源

llama3.3-70b-cn

Llama 中文优化

¥0.001/¥0.002开源

deepseek-v3-open

DeepSeek 开源镜像

¥0.0008/¥0.001开源

internlm-2.5

上海AI实验室书生

¥0.001/¥0.002开源

一行代码接入

⟨OpenAI⟩ 协议完全兼容

已有 OpenAI 代码无需改造。只换 base_url,即可访问全部国产模型。

~/quickstart.py · Python

1# 只换 base_url,即可调用 50+ 国产模型
2from openai import OpenAI
3
4client = OpenAI(
5    base_url="https://api.wangenyun.com/v1",
6    api_key="sk-wgy-************",
7)
8
9resp = client.chat.completions.create(
10    model="deepseek-v3",
11    messages=[
12        {"role": "system", "content": "你是有用的助手"},
13        {"role": "user", "content": "介绍一下万根云"},
14    ],
15    stream=True,
16)
17for chunk in resp:
18    print(chunk.choices[0].delta.content, end="")

不止 Python

Node.js openai → ChatCompletion.create({ model: 'deepseek-v3', ... })

Go go-openai → ChatCompletion(ctx, req)

cURL curl -H "Authorization: Bearer sk-wgy-…" /v1/chat/completions

LangChain ChatOpenAI(base_url=…, model='qwen3-max')

Dify 模型供应商 → OpenAI-API-compatible → 填 base_url

兼容协议覆盖

chat/completions completions embeddings images/generations audio/transcriptions tools / function-calling vision · multi-modal

数据不出域

三种部署形态,
覆盖企业 99% 场景。

// 公有云

API 直连

万根公有云推理集群。OpenAI 协议,按量付费,最快接入。适合 ToC、SaaS 应用。

延迟

P95 < 500ms

起步

¥0.001/K

SLA

99.95%

部署

5 分钟

// 专享集群

独占算力

独立 GPU 资源池,流量隔离,高并发不抢占。带 99.99% SLA,可自选模型组合。

GPU

H800 / H100 起

起步

¥18K / 月

SLA

99.99%

部署

3 工作日

// 私有化

本地部署

整机柜交付至您机房。模型权重 + 推理框架 + 运维平台一站式给到。数据完全自控。

规格

8U / 16U / 整柜

起步

¥180K / 套

合规

等保 / 信创

部署

10 工作日

FAQ

常见问题

万根云的 AI 服务和直接对接厂商 API,有什么区别?

核心区别在三个层面:(1) 接入成本:50+ 模型只需 1 个 Key,统一 OpenAI 协议;(2) 计费与配额:一张账单覆盖所有模型,可按团队/项目分账;(3) 工程稳定性:智能路由、限速、降级、语义缓存全部内建,主流模型故障时自动 fallback。计费上原价 1:1 直通,网关本身不加成。

调用本地 / 私有部署模型,可以走同一个 API 吗?

可以。在控制台注册你的私有模型端点(支持 vLLM / Ollama / SGLang),万根网关会把它当成一个新的 model name 暴露出来。你的代码不变,只把 model 参数换成自定义名字即可。请求会被路由到你指定的私有节点,不会走公网。

语义缓存是怎么工作的?

每次请求的 prompt 会被嵌入向量化,与历史请求做相似度匹配。命中阈值时直接返回缓存答案,跳过模型调用。可以按 API Key / 项目 / 模型粒度隔离缓存,也可以关闭。线上客户平均节省 38% Token 成本,P95 延迟 < 100ms。

数据安全和合规情况?

万根云通过 ISO 27001、等保 2.0 三级、可信云增强等认证。API 调用日志默认 30 天滚动,客户可在控制台开启关闭。私有化部署版本支持完整的离线运行,模型权重与日志均不出域,适合金融、政企客户。

如何切换模型?需要改代码吗?

不需要改代码。只需在请求体里把 model: "deepseek-v3" 换成 model: "qwen3-max" 即可。如果开启了智能路由,你甚至可以传 model: "auto",系统按任务类型、延迟、成本自动选择。

开源模型和商业模型怎么选?

商业模型(DeepSeek-V3、通义、文心等)直连官方,延迟低、效果稳;开源模型由万根托管运行,价格更低,且可以申请权重做私有化、微调。一般建议:正式产品用商业 API,研发/测试或对成本敏感场景用开源镜像。两者都支持平滑切换。

把国产大模型装进你的产品。

从一行 API,到一柜机器。

Token 调用

算力租赁

私有化部署

模型微调

主流模型,按厂商分组。

⟨OpenAI⟩ 协议完全兼容

不止 Python

兼容协议覆盖

三种部署形态,覆盖企业 99% 场景。

API 直连

独占算力

本地部署

常见问题

注册即送 1000 万 Token所有国产模型通用。

把国产大模型
装进你的产品。

从一行 API,
到一柜机器。

主流模型,
按厂商分组。

三种部署形态,
覆盖企业 99% 场景。

注册即送 1000 万 Token
所有国产模型通用。