Meta堕入惊险？里面爆料：在猖獗分析复制DeepSeek，高预算难以解释

发布日期：2025-03-03 06:53 点击次数：187

「工程师正在猖獗地分析 DeepSeek，试图从中复制任何可能的东西。」

DeepSeek 开源大模子的阳谋，切切实实轰动着好意思国 AI 公司。

开赴点堕入惊险的，似乎是相通顾惜开源的 Meta。

最近，有 Meta 职工在好意思国匿名职场社区 teamblind 上头发布了一个帖子。帖子提到，国内 AI 创业公司 DeepSeek 最近的一系列行动让 Meta 的生成式 AI 团队堕入了惊险，因为在前者的低资本大叫大进下，后者无法解释我方的超高预算的合感性。

原文如下：

这一切始于 DeepSeek-V3，它在基准测试中就如故让 Llama 4 逾期。更晦气的是阿谁「领有 550 万考试预算的不着名中国公司」。

工程师们正在猖獗地分析 DeepSeek，试图从中复制任何可能的东西。这少量皆不夸张。

解决层惦记若何解说遍及的生成式 AI 组织的资本是合理的。当生成式 AI 组织中的每个「辅导」的薪资皆比考试系数这个词 DeepSeek-V3 的资本还要高，而咱们有好几十个这么的「辅导」时，他们要若何面临高层？

DeepSeek-R1 让情况变得愈加可怕。天然我不成泄漏奥妙信息，但这些很快就会公开。

这本应该是一个以工程为要点的袖珍组织，可是因为好多东谈主念念要参与进来分一杯羹，东谈主为地彭胀了组织的招聘规模，效用每个东谈主皆成了输家。

原贴连络：https://www.teamblind.com/post/Meta-genai-org-in-panic-mode-KccnF41n

帖子中提到的 DeepSeek-V3 和 DeepSeek-R1 分离发布于 2024 年 12 月 26 日和 2025 年 1 月 20 日。

其中，DeepSeek-V3 在发布时提到，该模子在多项评测得益突出了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模子，并在性能上和寰宇顶尖的闭源模子 GPT-4o 以及 Claude-3.5-Sonnet 不分昆仲。

不外，更引东谈主温雅的是，这个参数目高达 671B 的大型话语模子考试资本仅 558 万好意思元。具体来说，它的预考试历程居然只用了 266.4 万 H800 GPU Hours，再加上坎坷文扩展与后考试的考试，系数也独一 278.8 H800 GPU Hours。相较之下，Meta 的 Llama 3 系列模子的盘算预算则多达 3930 万 H100 GPU Hours—— 如斯盘算量足可考试 DeepSeek-V3 至少 15 次。

而最近发布的 DeepSeek-R1 性能更猛 —— 在数学、代码、天然话语推理等任务上，它的性能并列 OpenAI o1 郑再版。何况模子在发布的同期，权重同步开源。好多东谈主惊呼，本来 DeepSeek 才是实在的 OpenAI。UC Berkeley 训导 Alex Dimakis 则以为， DeepSeek 当前如故处于朝上位置，好意思国公司可能需要奋起直追了。

看到这里，咱们不难聚拢为何 Meta 的团队会堕入惊险。要是本年推出的 Llama 4 莫得点硬措施，他们「开源之光」的地位岌岌可危。

有东谈主指出，其实该慌的不啻 Meta，OpenAI、谷歌、Anthropic 又何尝莫得受到挑战。「这是一件善事，咱们不错及时看到公开竞争对更动的影响。」

还有东谈主惦难忘了英伟达的股价，示意「要是 DeeSeek 的更动是简直，那 AI 公司是否简直需要那么多显卡？」

不外，也有东谈主质疑，DeepSeek 究竟是靠更动照旧靠蒸馏 OpenAI 的模子取胜？有东谈主回复说，这不错从他们的发布的技能敷陈中找到谜底。

当前，咱们还无法详情帖子的真实性。

不知谈 Meta 后续将若何回答，行将到来的 Llama 4 又会达到奈何的性能。

著述起首：机器之心，原文标题：《Meta堕入惊险？里面爆料：在猖獗分析复制DeepSeek，高预算难以解释》

风险教唆及免责条件市集有风险，投资需严慎。本文不组成个东谈主投资提倡，也未磋议到个别用户终点的投资目标、财务现象或需要。用户应试虑本文中的任何观点、不雅点或论断是否适应其特定现象。据此投资，包袱自夸。

上一篇：奥特曼晒「星际之门」首期工场，全好意思狂建20座超算！70万块GPU老黄爆赚375亿

下一篇：中金：算力老本开支加码，看好AIDC电气架构的系统性投资契机