AI
yuhuo2025-03-12开发知识
AI 大模型
第一梯队
公司 | 模型版本 | 应用名称 | 是否开源 | 说明 |
---|---|---|---|---|
深度求索 | DeepSeek V3 DeepSeek R1 推理 | DeepSeek | 开源 | 技术创新大幅降低训练成本和 API 价格,MIT 协议免费商用; R1 推理能力比肩 GPT o1,V3-0324 占据非推理模型榜首; |
阿里巴巴 | Qwen Plus / Max / Omni-Turbo QwQ-32B 推理 | Qwen 通义千问 | 开源 - 同时保留对应最新的商业版(带 max、plus、turbo 之类后缀) | 全尺寸、全模块开源,生态领先,Apache2.0 协议免费商用; QwQ-32B 小参数量推理能力追平 DeepSeek-R1 671B,实现消费级显卡部署; |
字节跳动 | Doubao 1.5-pro / 1.5-vision-pro | 豆包 | 闭源 | 月活量高,体验好,背靠抖音 / 头条生态 |
OpenAI | GPT- 4o mini / 4o / 4.5 Preview GPT o1 / o3-mini 推理 | ChatGPT | 闭源 | 闭源标杆,4o 多模态模型,o3 推理模型; C 端分层收费:Free,Plus -20$/月, Pro - 200$/月,分别对应无限制使用 4o mini,o3-mini,4o |
xAI | Grok-1 / 3 Grok 3 Reasoning Beta 推理 | Grok | 部分开源 - Grok-1开源, Grok3 闭源 | 10 万块 H100 芯片加持,推理能力强,背靠推特生态,实时信息整合 |
Meta | Llama 3.1 / 3.2 / 3.2 Vision / 3.3 | Llama | 开源,但包含使用限制 | 开源先驱 |
Anthropic | Claude Instant / 3.5 / 3.7 Sonnet Claude 3.7 Sonnet Thinking 推理 | Claude | 部分开源 - Claude Instant 开源,Claude 3 闭源 | 编程能力最强 |
谷歌 | Gemma3 Gemini 2.0 Flash Gemini 2.0 Flash Thinking / 2.0 Pro 推理 | Gemini Google AI Studio | 部分开源 - Gemma 轻量开源,Gemini 旗舰闭源 | 多模态能力(支持图像视频输入),低算力适配(27B 可以单卡GPU 运行),128k 超长上下文和140多种语言支持 |
第二梯队
公司 | 模型版本 | 应用名称 | 是否开源 | 说明 |
---|---|---|---|---|
百度 | 文心4.5 文心X1 推理 | 文心一言 | 闭源 | 集成百度搜索数据 |
腾讯 | 混元 | 元宝 | 闭源 | 背靠微信 / QQ 生态 |
智谱华章 | ChatGLM3-10B | 智谱清言 | 部分开源 | 清华大学孵化,知识图谱增强 |
百川智能 | Baichuan2-13B | 百小应 | 部分开源 | 中小模型开源,垂类定制 |
月之暗面 | Kimi k1.5 / k1.6 | Kimi | 闭源 | 长文本能力突出 |
稀宇科技 | MiniMax-01 | MiniMax | 部分开源 | 聚焦图片视频生成 |
大模型开发流程
- 数据处理:数据采集 → 数据清洗 → 数据标注 → 数据预处理
- 模型训练:训练代码 + 训练数据 → 模型训练 → 模型验证 → 模型优化 → 模型文件
- 部署应用:推理代码 + 模型文件 → 模型部署 → 业务应用
大模型开源
大模型开源不同于传统软件开源。传统软件开源是完全公开所有代码,大模型开源一般通过【Hugging Face / 魔搭】开源模型文件(权重文件),并通过【Github】开源推理代码、部分训练代码、工具及技术报告,并不会完全公开完整的训练过程和训练数据。
比如 DeepSeek 在【Github】上公布了 DeepEP、FlashMLA、DeepGEMM 等模型训练的工具库。
大模型训练是一个极其复杂的系统工程。除了代码和数据外,还涉及到模型架构设计、超参数调整、分布式训练策略、训练稳定性优化、硬件适配等诸多关键要素和技术细节。因此这些开源旨在推动技术发展,构建技术生态,单靠开源信息没办法完全复刻出相同的模型。
用户群体与用途
- GitHub:面向开发者和研究人员,适合希望深入研究模型架构、优化训练过程或复现技术的用户。
- Hugging Face / 魔搭:面向更广泛的 AI 应用开发者,提供开箱即用的模型,方便快速部署和集成到产品中。
AI 图片视频平台
公司 | 应用名称 | 是否开源 | 说明 |
---|---|---|---|
阿里巴巴 | 通义万相 | 闭源 | 免费 |
字节跳动 | 即梦 | 闭源 | 分层收费 |
快手 | 可灵 | 闭源 | 分层收费 |
稀宇科技 | 海螺 | 闭源 | 分层收费 |
AI 应用搭建平台
公司 | 应用名称 | 是否开源 | 说明 |
---|---|---|---|
苏州语灵 | Dify | 开源 | 全链路开源,开源社区活跃,国际化程度高 |
环界云计算 | FastGPT | 部分开源 | 聚集知识库问答,适合深度定制和复杂功能 |
字节跳动 | 扣子 | 闭源 | 集成字节生态,不支持私有化部署,适合 C 端用户 |
AI 编程工具
公司 | 应用名称 | 是否开源 | 类型 | 说明 |
---|---|---|---|---|
微软 | GitHub Copilot | 闭源 | 插件(33M⬇️) | 使用 Claude / Gemini / GPT 模型 免费版(50 次请求 + 2000 次补全 / 每月) Pro版(10$ / 每月) |
阿里巴巴 | 通义灵码 | 闭源 | 插件(1.2M⬇️) | 使用 DeepSeek / Qwen 模型,免费 |
开源社区 | Cline / RooCline | 开源 | 插件(1.1M⬇️) | 需要自己购买配置大模型 API |
字节跳动 | 豆包 MarsCode | 闭源 | 插件(0.8M⬇️) | 使用 Doubao 模型,免费 |
谷歌 | Gemini Code Assist | 闭源 | 插件(0.5M⬇️) | 使用 Gemini 模型 免费版,标准版(19$ / 每月) |
Anysphere | Cursor | 闭源 | IDE | 使用 Claude / Gemini / GPT 模型 免费版(50 次请求 + 2000 次补全 / 每月) Pro版(20$ / 每月) |
Codeium | Windsurf | 闭源 | IDE | 使用 Claude / DeepSeek / GPT 模型 免费版,标准版(15$ / 每月) |
字节跳动 | Trae | 闭源 | IDE | 使用 DeepSeek / Doubao 模型,免费 |
AI 代理工具
公司 | 应用名称 | 是否开源 | 特点 |
---|---|---|---|
蝴蝶效应 | Manus | 闭源 | 自主执行复杂任务 |
蝴蝶效应 | Monica | 闭源 | 浏览器插件,浏览器里的 AI 场景化助手 |
字节跳动 | 豆包浏览器插件 | 闭源 | 浏览器插件,浏览器里的 AI 场景化助手 |
AI 第三方平台
公司 | 说明 |
---|---|
Hugging Face | 大模型开源社区 |
魔搭 | 大模型开源社区(国内) |
Artificial Analysis | 大模型评测平台 |
Chatbot Arena | 大模型评测平台 |
API 收费标准
文本模型
模型版本 | 输入 (元/百万 token) | 输出 (元/百万 token) | 免费额度 万 token |
---|---|---|---|
Deepseek-V3 ✔️ | 2 | 8 | 火山 50 / 百炼 100 |
Deepseek-R1 ✔️ | 4 | 16 | 火山 50 / 百炼 100 |
--- | --- | --- | --- |
Doubao-1.5-pro-32k ✔️ | 0.8 | 2 | 50 |
Doubao-1.5-pro-256k | 5 | 9 | 50 |
Doubao-1.5-vision-pro-32k ✔️ | 3 | 9 | 50 |
--- | --- | --- | --- |
Qwen-Plus | 0.8 | 2 | 100 |
Qwen-Max✔️ | 2.4 | 9.6 | 100 |
Qwen-Omni-Turbo ✔️ | 1.5 | 4.5 | 100 |
QwQ-32B ✔️ | 2 | 6 | 100 |
--- | --- | --- | --- |
GPT-4o-mini | $0.15 ≈ 1.1 | $0.6 ≈ 4.3 | |
GPT-4o | $2.5 ≈ 18 | $10 ≈ 72 | |
GPT o3-mini | $1.1 ≈ 7.9 | $4.4 ≈ 31.7 |
图片生成模型
模型版本 | 价格 | 免费额度 |
---|---|---|
Doubao-文生图模型-智能绘图 | 0.2 元/次 | 200 次 |
Wanx2.1-t2i-plus | 0.2 元/次 | 500 次 |
视频生成模型
模型版本 | 价格 | 免费额度 |
---|---|---|
Doubao-视频生成-Seaweed | 30 元/百万 token (以 1280*720 为例,折合 0.648 元/秒) | 200 万 token |
Wanx2.1-t2v-plus | 0.7 元/秒 | 200 秒 |
Wanx2.1-i2v-plus | 0.7 元/秒 | 200 秒 |
TIP
Wanx 通义万相,t = text,i = image,v = video。所以 t2v 表示文生视频,i2v 表示图生视频。