最好看的新闻,最实用的信息
01月31日 24.1°C-24.1°C
澳元 : 人民币=4.47
达尔文
今日澳洲app下载
登录 注册

DeepSeek崛起,一场全球AI话语权的深度转移(图)

1天前 来源: 虎嗅网 原文链接 评论0条

本文转载自虎嗅网,仅代表原出处和原作者观点,仅供参考阅读,不代表本网态度和立场。

如果你相信AI将是21世纪“人类科技树”上最重要的技能点的话,那么中国正在抢占先机。

1月27日,中国公司深度求索(DeepSeek)旗下生成式AI产品DeepSeek(与公司同名)同时登顶中国区和美国区苹果AppStore免费榜。这是第一次,有中国科技产品APP实现双榜登顶。被DeepSeek压在身后的,包括了OpenAI旗下的ChatGPT以及Google Gemini等AI产品。

造成DeepSeek登顶的推动力,是其在1月20日发布的推理大模型DeepSeek-R1。

这款免费的推理大模型在大模型排行榜“ Chatbot Arena”上,已经和 OpenAI旗下ChatGPT-4o(最新版)并列基准测试排名第三, 并和OpenAI的旗下的o1模型在Chatbot Arena风格控制类模型分类(即StyleCtrl)中并列第一名。根据DeepSeek自己公布的信息“DeepSeek-R1在Codeforces、GPQA Diamond、MATH-500、MMLU、SWE-bench Verified等测试中,得分与o1正式版接近,部分测试中得分还超过o1正式版。”

DeepSeek崛起,一场全球AI话语权的深度转移(图) - 1

两个关键词,让DeepSeek在“评测排名”之外引发滔天热度:开源+性价比。

DeepSeek-R1是一款开源推理大模型。基于MIT许可协议(即 MIT License,起源于1988年,是科技圈最主流的开源软件许可协议之一)DeepSeek-R1允许全球开发者自由地修改、使用、分发模型。甚至DeepSeek-R1允许开发者进行衍生开发和商用。

作为对比,OpenAI旗下主流产品产品(GPT-3.5、GPT-4、GPT-o1、GPT-o3、ChatGPT、DALL-E),截至目前都是闭源产品。OpenAI曾把GPT-2进行了“部分开源”,但基于GPT-2的“开源”并非基于MIT许可协议,使用者有相当多的限制和前置条件。同样,OpenAI曾在一些场合公开展示过 Codex 的部分代码,但这和真正的开源模式全然不同。

DeepSeek开源带给OpenAI的巨大挑战是,当开源产品的“能力”和闭源产品接近甚至反超后者时,对闭源产品的冲击将是巨大的。DeepSeek下载热度的激增,背后的核心原因之一正是开源:用户可以在自己的服务器或云端免费部署DeepSeek-R1,且大幅降低(甚至不需要)API调用费用。根据DeepSeek和OpenAI公布的信息显示,DeepSeek-R1的输入token定价为0.55 美元/百万,输出 token为2.19 美元/百万;而OpenAI相应的输入token定价约为15 美元/百万,输出token为60美元/百万。相当于,OpenAI的“使用成本”接近于27.3倍。

而DeepSeek第二个惊人之处,则是其预训练成本了。公开信息显示, DeepSeek-V3的预训练成本约为557.6万美元,整体消耗了278万GPU小时训练时长。作为对比,OpenAI仅仅是GPT-4的训练成本就接近1亿美元(虎嗅注:《斯坦福大学人工智能指数数据报告 2024》认为GPT-4 的训练成本约为 7800 万美元)。

DeepSeek对OpenAI模式说“不”

DeepSeek的迅速火爆,尚不能说直接戳破过去几年OpenAI所塑造的“AI神话”,但确实证明了,在OpenAI之外,存在一种完全不同的AI生存逻辑。

OpenAI的模式本质上基于研发和产品侧的高投入,这也是英伟达等美国科技巨头在过去几年所力推的“算力无限主义”,通过无限堆砌算力不断拉高人工智能的边界。而一系列诸如英伟达的公司,扮演着OpenAI模式里的“生态位”公司,与OpenAI形成攻守同盟。

OpenAI最大投入是“硬件算力”和“训练及数据成本”。前者,OpenAI通过多笔融资,以及被纳入“微软联盟”后依托微软提供的“算力券”模式获得补给;后者OpenAI通过大量雇佣训练相关人员并与大量数据公司合作,形成稳定的“数据收集、清洗、标注闭环”。在这两大基本轴的共同运转下,OpenAI成为了过去几年AI圈的绝对明星。

这一模式,形成了一个由不同“生态位”公司构筑成的“AI有机体”,这个“AI有机体”形成了美国AI内核的基石之一。

在OpenAI的上游,微软扮演着提供基础给养的角色,而为了提供足够的云和算力,微软也成为英伟达等公司的关键客户,每年数以百亿美元计地采购相关硬件。在这一“AI有机体”里,不只是微软和英伟达这样的超级巨头,还包括了Crusoe Energy这样专注于数据中心、基础设施的公司,它们都成为这个“AI有机体”的关键一环。

在“AI有机体”里还有大量围绕“数据”而存活的公司,诸如Scale AI等数据标注类公司,源源不断给OpenAI提供养料。

这个“AI有机体”本身,绝非是简单的订单采购的供给关系。OpenAI的大部分产品,多数需要在英伟达等公司的高级芯片上布置,一些低端芯片是无法布置OpenAI产品的。同样,微软不只是OpenAI的股东、算力提供者,OpenAI也是其AI产品的供应商,二者本质上是一种深层的同盟关系。

也就是说,围绕OpenAI模式(高额的训练投入、高额的算力供给、布置在高端芯片上、闭源的)实际上衍变出来的正是这样的一个涵盖了巨额生意的“美式AI生态有机体”。

甚至这一模式与有机体,决定着美国AI道路的方向。在不久前特朗普的5000亿美元星际之门计划中,OpenAI创始人奥特曼正是重要参与者。这一计划被视为美国AI领域的“曼哈顿计划”。

而当2025年初,DeepSeek把自己开源、更低成本投入的模型拿到台面上时。真正感受到危机的,正是这个“美式AI生态有机体”。

1月27日美股盘前,英伟达股价一度跌幅达到12%,截至收盘时英伟达股价暴跌17%。”造成英伟达股价暴跌的核心原因有二:其一,DeepSeek-R1等产品并不“必须”在英伟达高端芯片上部署,甚至可以在一些中低端芯片上部署;其二,DeepSeek所公布的训练成本和投入,对于高度依赖巨额算力投入、在预训练上需要大量GPU时长的“OpenAI-英伟达”模式直接Say No。这可能预示着,在“挖矿”之后,英伟达在AI大模型圈找到的饭票,已经不再保险。

而更深刻的一击是来自于“开源”本身。在微软、OpenAI、英伟达等公司构筑出的这个“美式AI生态有机体”中,商业化的前体是“不能开源”——要通过AI模型本身收费或者将其纳入付费产品之中完成商业闭环。

当DeepSeek举起“开源大旗”时,一种不同于“美式AI生态有机体”的AI世界正在开启大门:当圣何塞硅谷、北京中关村、新德里诺伊达、巴黎九区的创业者都可以免费地部署不属于OpenAI产品的开源大模型并研发自己领域的项目和产品时,AI本身更像是人们在本世纪初对于其“新生产资料”的设定和预期。

讽刺的是,开源本是OpenAI最早的梦想,但最终这个大旗被一家中国的、原本做量化基金的公司不经意间举起来了。

这是一次“马镫与蒸汽机”般的里程碑事件吗?

大概率是的。

我们先回顾一段历史,这一幕有可能是今天AI世界的前传。

在1765年英国人瓦特发明出蒸汽机后,瓦特以及后续的英国发明家马修·博尔顿、和乔治·斯蒂芬逊接连在蒸汽机商业化、蒸汽火车等领域继续研发,并推动英国的蒸汽化。

但一个关键的节点事件是1807年美国人罗伯特·富尔顿发明了第一个蒸汽商用轮船,这是美国第一次去分享英国在“蒸汽化”这件事上的科技及产品话语权。而在不久后,美国人奥利弗·埃文斯等人,开始推动蒸汽化在美国工厂的落地,于是美国出现了最早一批基于蒸汽机的自动化工业生产线——也就是说,英国人发明出的蒸汽机,但他们并未能独占蒸汽时代的“母基发明”。

而随之而来的是,当美国成为“蒸汽时代”领头者之一并凭借更庞大的国力底蕴去完成了“围绕新关键科技的全盘进化”后,其彻底在英国开启的霸主时代中撕开了一条缝隙,并最终取而代之。

这个故事里的关键逻辑是,当人类的科技树出现“超级节点”时,最先探索出这个技术节点的国家/民族,有时候并未能品尝到这个超级技术节点完整红利:推动关键技术国民级商业化的效率以及整体国力的深层底蕴才是博弈的关键。同样的事情在蒸汽机之后的多个“天才技术时刻”都再次重演了,在AI时代这一幕可能继续。

DeepSeek这件事的意义,不仅仅是技术侧。甚至我们应该一点也不奇怪,几个月后中国或者美国或者什么地方,又诞生出了更先进的大模型产品。

但我们应该看到这件事背后的深层意义:一家诞生在中国的民营公司,绕开了美国人所探索的“成功模式道路”,并采取了代表“开放、普惠价值”内核的“开源精神”。如果考虑到DeepSeek大量工程师是一群只在中国本国高校求学过的本土95后甚至00后才俊的话,不难洞察到一场更深层的、涉及人类时代科技话语权的交接,可能已经发生了。

在不久前,一家国内头部端侧大模型公司创始人在与虎嗅交流时分享了一个有趣的细节:“2024年上半年,我去参加国际上的AI论坛,大部分面孔是美国人、印度人,但是2024年下半年这些AI国际学术峰会论坛里,中国人的面孔已经占一半以上。”

接下来,这场围绕全球AI角力关键视角有三:

其一,在中端视角中,能否确保DeepSeek以及更多的本土DeepSeek诞生、崛起、并长成国民级商业体;这包括了DeepSeek创始人梁文锋近期所提及的如何让硬核科技创业者得到足够大的正向反馈问题。而延展而来的是,在过去20年间,国内多数获得正向反馈的“科技”创业,多为模式创新,最终这些公司进化为平台型巨头,掌握流量出入口,然后反向重塑诸如餐饮、超市等一系列日常生意。少有的恰恰是,更为纯粹的硬核科技创新。

其二,在更大的视角中,在这场人类21世纪的AI浪潮里,比拼谁哪个经济体可以更快速地完成工业与生活AI化,从单纯的“器”的研究,率先进入到“机理”的探索与推广。即上文提及的推动关键技术国民级商业化的效率以及如何借力于雄厚的整体国力迅速建立足够高的竞争壁垒。

当然,回归更小的视角中,对于中国本土那几个尚在模仿OpenAI的大模型公司而言,2025年初所发生的事情,可能已经不只是引起“警觉”,而是引发“惊悚”了。

毕竟,素来乐于研究美国硅谷的中国投资圈,一定会重新审视此前那些投入额数以十亿、百亿计的本土生成式AI项目了。

本文转载自虎嗅网,仅代表原出处和原作者观点,仅供参考阅读,不代表本网态度和立场。

今日评论 网友评论仅供其表达个人看法,并不表明网站立场。
最新评论(0)
暂无评论


Copyright Media Today Group Pty Ltd.隐私条款联系我们商务合作加入我们

电话: (02) 8999 8797

联系邮箱: [email protected] 商业合作: [email protected]网站地图

法律顾问:AHL法律 – 澳洲最大华人律师行新闻爆料:[email protected]

友情链接: 华人找房 到家 今日支付Umall今日优选