AI

yuhuo2025-03-12开发知识
参考链接

AI 大模型

第一梯队

公司模型版本应用名称是否开源说明
深度求索DeepSeek V3
DeepSeek R1 推理
DeepSeekopen in new window开源技术创新大幅降低训练成本和 API 价格,MIT 协议免费商用;
R1 推理能力比肩 GPT o1,V3-0324 占据非推理模型榜首;
阿里巴巴Qwen Plus / Max / Omni-Turbo
QwQ-32B 推理
Qwenopen in new window
通义千问open in new window
开源 - 同时保留对应最新的商业版(带 max、plus、turbo 之类后缀)全尺寸、全模块开源,生态领先,Apache2.0 协议免费商用;
QwQ-32B 小参数量推理能力追平 DeepSeek-R1 671B,实现消费级显卡部署;
字节跳动Doubao 1.5-pro / 1.5-vision-pro豆包open in new window闭源月活量高,体验好,背靠抖音 / 头条生态
OpenAIGPT- 4o mini / 4o / 4.5 Preview
GPT o1 / o3-mini 推理
ChatGPTopen in new window闭源闭源标杆,4o 多模态模型,o3 推理模型;
C 端分层收费:Free,Plus -20$/月, Pro - 200$/月,分别对应无限制使用 4o mini,o3-mini,4o
xAIGrok-1 / 3
Grok 3 Reasoning Beta 推理
Grokopen in new window部分开源 - Grok-1开源, Grok3 闭源10 万块 H100 芯片加持,推理能力强,背靠推特生态,实时信息整合
MetaLlama 3.1 / 3.2 / 3.2 Vision / 3.3Llamaopen in new window开源,但包含使用限制开源先驱
AnthropicClaude Instant / 3.5 / 3.7 Sonnet
Claude 3.7 Sonnet Thinking 推理
Claudeopen in new window部分开源 - Claude Instant 开源,Claude 3 闭源编程能力最强
谷歌Gemma3
Gemini 2.0 Flash
Gemini 2.0 Flash Thinking / 2.0 Pro 推理
Geminiopen in new window
Google AI Studioopen in new window
部分开源 - Gemma 轻量开源,Gemini 旗舰闭源多模态能力(支持图像视频输入),低算力适配(27B 可以单卡GPU 运行),128k 超长上下文和140多种语言支持

第二梯队

公司模型版本应用名称是否开源说明
百度文心4.5
文心X1 推理
文心一言open in new window闭源集成百度搜索数据
腾讯混元元宝open in new window闭源背靠微信 / QQ 生态
智谱华章ChatGLM3-10B智谱清言open in new window部分开源清华大学孵化,知识图谱增强
百川智能Baichuan2-13B百小应open in new window部分开源中小模型开源,垂类定制
月之暗面Kimi k1.5 / k1.6Kimiopen in new window闭源长文本能力突出
稀宇科技MiniMax-01MiniMaxopen in new window部分开源聚焦图片视频生成

大模型开发流程

  • 数据处理:数据采集 → 数据清洗 → 数据标注 → 数据预处理
  • 模型训练:训练代码 + 训练数据 → 模型训练 → 模型验证 → 模型优化 → 模型文件
  • 部署应用:推理代码 + 模型文件 → 模型部署 → 业务应用

大模型开源

大模型开源不同于传统软件开源。传统软件开源是完全公开所有代码,大模型开源一般通过【Hugging Face / 魔搭】开源模型文件(权重文件),并通过【Github】开源推理代码、部分训练代码、工具及技术报告,并不会完全公开完整的训练过程和训练数据。

比如 DeepSeek 在【Github】上公布了 DeepEP、FlashMLA、DeepGEMM 等模型训练的工具库。

大模型训练是一个极其复杂的系统工程。除了代码和数据外,还涉及到模型架构设计、超参数调整、分布式训练策略、训练稳定性优化、硬件适配等诸多关键要素和技术细节。因此这些开源旨在推动技术发展,构建技术生态,单靠开源信息没办法完全复刻出相同的模型。

用户群体与用途

  • GitHub:面向开发者和研究人员,适合希望深入研究模型架构、优化训练过程或复现技术的用户。
  • Hugging Face / 魔搭:面向更广泛的 AI 应用开发者,提供开箱即用的模型,方便快速部署和集成到产品中。

AI 图片视频平台

公司应用名称是否开源说明
阿里巴巴通义万相open in new window闭源免费
字节跳动即梦open in new window闭源分层收费
快手可灵open in new window闭源分层收费
稀宇科技海螺open in new window闭源分层收费

AI 应用搭建平台

公司应用名称是否开源说明
苏州语灵Difyopen in new window开源全链路开源,开源社区活跃,国际化程度高
环界云计算FastGPTopen in new window部分开源聚集知识库问答,适合深度定制和复杂功能
字节跳动扣子open in new window闭源集成字节生态,不支持私有化部署,适合 C 端用户

AI 编程工具

公司应用名称是否开源类型说明
微软GitHub Copilotopen in new window闭源插件(33M⬇️)使用 Claude / Gemini / GPT 模型
免费版(50 次请求 + 2000 次补全 / 每月)
Pro版(10$ / 每月
阿里巴巴通义灵码open in new window闭源插件(1.2M⬇️)使用 DeepSeek / Qwen 模型,免费
开源社区Cline / RooClineopen in new window开源插件(1.1M⬇️)需要自己购买配置大模型 API
字节跳动豆包 MarsCodeopen in new window闭源插件(0.8M⬇️)使用 Doubao 模型,免费
谷歌Gemini Code Assistopen in new window闭源插件(0.5M⬇️)使用 Gemini 模型
免费版,标准版(19$ / 每月
AnysphereCursoropen in new window闭源IDE使用 Claude / Gemini / GPT 模型
免费版(50 次请求 + 2000 次补全 / 每月)
Pro版(20$ / 每月
CodeiumWindsurfopen in new window闭源IDE使用 Claude / DeepSeek / GPT 模型
免费版,标准版(15$ / 每月
字节跳动Traeopen in new window闭源IDE使用 DeepSeek / Doubao 模型,免费

AI 代理工具

公司应用名称是否开源特点
蝴蝶效应Manusopen in new window闭源自主执行复杂任务
蝴蝶效应Monicaopen in new window闭源浏览器插件,浏览器里的 AI 场景化助手
字节跳动豆包浏览器插件open in new window闭源浏览器插件,浏览器里的 AI 场景化助手

AI 第三方平台

公司说明
Hugging Faceopen in new window大模型开源社区
魔搭open in new window大模型开源社区(国内)
Artificial Analysisopen in new window大模型评测平台
Chatbot Arenaopen in new window大模型评测平台

API 收费标准

文本模型

模型版本输入
(元/百万 token)
输出
(元/百万 token)
免费额度
万 token
Deepseek-V3 ✔️28火山 50 / 百炼 100
Deepseek-R1 ✔️416火山 50 / 百炼 100
------------
Doubao-1.5-pro-32k ✔️0.8250
Doubao-1.5-pro-256k5950
Doubao-1.5-vision-pro-32k ✔️3950
------------
Qwen-Plus0.82100
Qwen-Max✔️2.49.6100
Qwen-Omni-Turbo ✔️1.54.5100
QwQ-32B ✔️26100
------------
GPT-4o-mini$0.15 ≈ 1.1$0.6 ≈ 4.3
GPT-4o$2.5 ≈ 18$10 ≈ 72
GPT o3-mini$1.1 ≈ 7.9$4.4 ≈ 31.7

图片生成模型

模型版本价格免费额度
Doubao-文生图模型-智能绘图0.2 元/次200 次
Wanx2.1-t2i-plus0.2 元/次500 次

视频生成模型

模型版本价格免费额度
Doubao-视频生成-Seaweed30 元/百万 token
(以 1280*720 为例,折合 0.648 元/秒)
200 万 token
Wanx2.1-t2v-plus0.7 元/秒200 秒
Wanx2.1-i2v-plus0.7 元/秒200 秒

TIP

Wanx 通义万相,t = text,i = image,v = video。所以 t2v 表示文生视频,i2v 表示图生视频。

Last Updated 2025/4/9 17:40:01