你的位置：| 开云·体育(中国)官方网站登录入口 > 新闻 > 开云体育最终掌捏完满煎蛋的手段-开云·体育(中国)官方网站登录入口

开云体育最终掌捏完满煎蛋的手段-开云·体育(中国)官方网站登录入口

发布日期：2026-04-03 08:55 点击次数：120

（原标题：DeepSeek是并排OpenAI的国产AI之光吗？）开云体育

“梁文峰以及他的团队显著是一群有“利润之上”的追求的东说念主们。”，这是段永平在雪球平台上对DeepSeek的评价。印象中，他上一次给出这样高评价的CEO，一经对苹果乔布斯的评价。

从2024年12月16日发布DeepSeek-V3后，在好意思国的AI圈得回了行业群众极高的评价，比如OpenAI创始团队成员卡帕斯（Andrej Karpathy）、英伟达的高档科学家Jim Fan等等。由于影响力太大，连OpenAI的CEO 山姆·奥特曼（Sam Altman）也出来发推阴阳了几句。

一、DeepSeek的才略与OpenAI最佳的模子不相险阻

1. 从DeepSeek-R1论文中与ChatGPT的各项才略成见对比来看，DeepSeek（后文简称为DS）照实是中国独一不错并排ChatGPT的AI大模子。

2. DS-V3的才略，在各项才略的测评上与ChatGPT-4o不相险阻。

这些评测（benchmarks）是由磋议东说念主员用心贪图，以揣测 AI 在推理、数学、编程、学问问答、话语都集等方面的才略。是以，评测遏抑的对比参考价值零散大。

二、DS-V3与DS-R1

上图中，在不选拔深度念念考（R1）时，DS默许是用V3回报的。在场景和才略上对标ChatGPT的4o。R1则对标o1，从前边的图表不错看出，R1在各项才略上都要比V3强出许多。

DS-V3 为自研 MoE 模子（群众混杂模子），举个栗子阐明MoE：

遐想一个餐厅，有不同厨师（群众），每位擅长一种菜系（如中餐、意大利菜、甜点）。顾主点菜时，司理（门控网罗）把柄菜品决定由哪位厨师认真。比如点披萨，意大利菜厨师接办；点宫保鸡丁，中餐厨师不休。司理确保每说念菜由最合乎的厨师完成。（起原于DS-V3）

DS-R1在后考试阶段大限制使用了强化学习（RL）本事，在仅有一丝标注数据的情况下（ChatGPT使用了无数的东说念主工标注数据），极大擢升了模子推理才略。举个栗子阐明纯强化学习（无监督数据）：

纯强化学习就像自学成才的厨师，通过持续尝试和失败，最终掌捏完满煎蛋的手段。天然过程劳作，但一朝得手，才略将零散苍劲且自主。（起原于DS-V3）

三、DS在工程上作念了许多创新

从各项才略的评测遏抑来看，开源的DS超过通盘的开源模子，何况与最佳的闭源模子（OpenAI的）不相险阻，莫得创新是不能能作念得回的。本事蹊径和一些步调是老早就有的，然则DS在工程上作念了许多创新。就像马斯克并莫得发明新的火箭与新的汽车，然则他通过工程创新极大的裁减了造火箭的资本，擢升了造火箭的服从。在电板上亦然通过工程创新极地面裁减了资本，减少了与整车的资本比例。

DS在工程上的创新：1. 无监督RL考试改进：创始跳过监督微调（SFT）的纯强化学习旅途，径直在基础模子上愚弄2. 高效蒸馏本事：通过80万条RL生成数据，将R1的推理才略蒸馏至1.5B-70B限制模子，终了小模子性能飞跃（如Qwen-32B在AIME 2024达72.6% pass@1）。（OpenAI的模子没开源，能看到的都是最终遏抑，这是没法蒸馏的。蒸馏需要敦厚模子的输出概率分散，拿学生模子的输出概率分散和敦厚的概率分散对比算一个KL散度蚀本函数，通过反向传播一步步优化学生模子的参数，场所是让学生模子的输出概率分散缓缓接近敦厚分散。惟有最终遏抑莫得di概率分散，你失去了绝大多数的有效信息，学不了的。AI行业群众@DrChuck ）考据蒸馏服从优于径直小模子RL考试，为资源受限场景提供高效决策，推理资本裁减80%。

3. 自稳健MoE群众选拔：动态路由算法+细粒度群众差别（128群众选2），比较密集模子减少70%计较量，长文本不休速率擢升40%。

创新点许多，就不逐个列举了。V3与R1的创新点对比：

备注：以上内容是通过DS阅读V3和R1论文回来得回的。

四、DS对AI生态的影响

大模子AI的三成分：数据、算法、算力。影响最大的是算法、算力。

1.算法

DS完全开源（最强的OpenAI是闭源），由于在工程上有许多创新，无疑给中国AI大模子创业带来特动手的朝阳。印象中百度李彦宏在2024年采访中提到，中国莫得契机再降生OpenAI这样的公司，DS的出现冲破了竞争时势。接下来抖音集团、腾讯、阿里等头部作念大模子的公司，省略率都会跟着DS的步调跟上。

2.算力

DS-V3的考试资本仅为557万好意思元，约为OpenAI、谷歌等公司的几十分之一。以Llama-3.1为例，其考试需要16000张H100卡且耗时数月，而DS-V3仅使用2048张H800卡，在两个月内就完成了考试，计较量约为Lama-3.1的八分之一。推理资本方面，DS-V3的每百万token用度仅为1好意思元，约为GPT 4 Turbo的七十分之一。

经过工程上的创新，同等AI才略的情况下，算力资本会大幅下落。不外，考试资本的下落意味着API资本也会大幅下落，这有益于C端愚弄的爆发，从而刺激更大的算力需求。芯片算力上，英伟达是都备的超过者，从英伟达设立的CUDA生态来看，在考试阶段当今仍难有替代者。DS这类大模子能否绕开英伟达的 CUDA 本事？谜底是本事上不错，但执行要看具体情况。

分两个场景看：

1. 推理（使用考试好的模子）：

完全不错绕开，就像手机软件换个手机也能驱动。模子考试好后仅仅一堆参数，用国产显卡（如天数、华为）或配套软件也能平淡使用，不依赖 CUDA。

2. 考试（从新教模子学习）：

当今可能仍用英伟达显卡（如公开贵寓深化 DeepSeek 在用 H800 芯片），但本事上存在替代决策：

决策一：用国产显卡（如天数）兼容 CUDA 生态，实测可行但速率可能稍慢。

决策二：用华为显卡+自研软件（如昇腾芯片+MindSpore 框架），或适配国产硬件的 PyTorch 版块，能终了考试但需调遣本事经由。

备注：以上内容是把柄行业从业者发言整理的@段嘉铭

结语：

开源的DS将会给我方设立起很强的竞争壁垒，因为关于AI愚弄，袼褙险些会占有绝大部分用户，然后在AI的三成分上轮回补强。看了梁文峰的不少发言，梁文峰不仅有才略，还有很大的时势，肯定在组织进化才略上也很强。

DS最佳的模子都开源，考试、推理资本均大幅下落，这无疑给粗莽的创业者带来了强大的契机，这个契机就好比早期的互联网创业。是以，年青的一又友们也得攥紧时刻磋议起来，这样的契机都备是几十年一遇！！！

$英伟达(NVDA)$ $腾讯控股(00700)$ $阿里巴巴(BABA)$ 开云体育

上一篇：开云体育与一架载有3名军东说念主的“黑鹰”直升机相撞后坠河-开云·体育(中国)官方网站登录入口
下一篇：开云(中国)kaiyun网页版登录入口成为全球市值最高的上市公司-开云·体育(中国)官方网站登录入口

开云体育最终掌捏完满煎蛋的手段-开云·体育(中国)官方网站 登录入口

开云体育最终掌捏完满煎蛋的手段-开云·体育(中国)官方网站登录入口