栏目分类
发布日期:2025-02-01 14:45 点击次数:133
前有宇树科技的机器狗视频让公共惊呼,还要啥波士顿能源。
紧接着又来了个国产大模子 DeepSeek,以至有股作念空英伟达的滋味。
具体咋回事儿,咱给你唠昭着咯。
前几天, DeepSeek 刚刚公布最新版块 V3 ,耀眼,与大洋此岸阿谁自称 Open ,却越来越 Close 的公司居品不同,这个 V3 是开源的。
不外开源还不是他最迫切的标签, DeepSeek-V3( 以下简称 V3 )还兼具了性能国外一流,时期力给力,价钱击穿地心三个特色,这一套不明释连招打得业内大模子厂商们皆有点昏昏欲睡了。
我揣摸老黄看到这头皮皆得发麻了吧。
同期, Meta 的 AI 时期官亦然直呼DeepSeek 的效能伟大。
知名 AI 评测博主 Tim Dettmers ,奏凯吹起来了,示意 DeepSeek 的责罚优雅 “elegant” 。
而在这些时期建立的东谈主,看着 V3 的成绩送去赞美的时候,也有些东谈主急了。
更故意旨兴致的是,作念到这些的公司既不是什么大厂,也不是纯血 AI 厂商。
DeepSeek 公司汉文名叫深度求索,他们本来和 AI 没任何联系。
就在大模子爆火之前,他们其实是私募机构幻方量化的一个团队。
而深度求索能够完了弯谈超车,既有点势必,也好像有点运谈的意旨兴致。
早在 2019 年,幻方就投资 2 亿元搭建了自研深度学习执行平台 “ 萤火虫一号 ” ,到了 2021 年照旧买了足足 1 万丈英伟达 A100 显卡的算力储备了。
要知谈,这个时候大模子没火,万卡集群的主张更是还没出现。
而恰是凭借这部分硬件储备,幻方才拿到了 AI 大模子的入场券,最终卷出了当今的 V3 。
你说好好的一个量化投资畛域的大厂,干嘛要跑来搞 AI 呢?
深度求索的 CEO 梁文锋在采纳采访的时候给公共聊过,并不是什么看中 AI 远景。
即是抱着这样股 “ 莽 ” 劲,深度求索才搞出了此次的大新闻,底下给公共具体讲讲 V3 有啥很是的地方。
当先即是性能强悍,现时来看,在 V3 眼前,开源模子简直没一个能打的。
而在各式大厂手里的闭源模子,那些公共耳熏目染的什么 GPT-4o 、 Claude 3.5 Sonnet 啥的, V3 也能打得有来有回。
你看到这,可能以为不外如斯,也即是追上了国外卓越水平嘛,值得这样吹吗?
狠恶的还在后头。
公共省略皆知谈了,当今的大模子即是一个通过遍及算力,让模子吃各式数据的真金不怕火丹经过。
在这个真金不怕火丹期,需要的是遍及算力和时期往里砸。
是以在圈子里有了一个新的计量单元 “GPU 时 ” ,也即是用了些许块 GPU 花了些许个小时的执行时期。
GPU 时越高,意味着销耗的时期、资产资本就越高,反之就物好意思价廉了。
前边说的此前开源模子王者, Llama 3.1 405B ,执行周期销耗了 3080 万 GPU 时。
可性能更强的 V3 ,只花了不到 280 万 GPU 时。
以钱来换算, DeepSeek 搞出 V3 版块,省略只花了 4000 多万东谈主民币。
而 Llama 3.1 405B 的执行时代, Meta 光是在老黄那买了 16000 多个 GPU ,保守揣摸至少皆花了十几亿东谈主民币。
你别以为 DeepSeek 靠的是什么歪门邪谈,东谈主家是正经八百的未必期傍身的。
为了搞清亮 DeepSeek 的时期咋样,我们挑升联系了语核科技首创东谈主兼 CTO 池光耀,他们主力发展企业向的 agent 数字东谈主,早即是 DeepSeek 的铁粉了。
池光耀告诉我们,此次 V3 的更新主若是 3 个方面的优化,区分是通讯和显存优化、推理民众的负载平衡以及FP8 搀杂精度执行。
各个部分怎么完了的咱也就未几说了,总体来说,大的举座结构没啥变化,更多的像是我们搞基建的那一套传统艺能,把工程作念得更高效、更合理了。
当先, V3 通过通讯和显存优化,极大幅度减少了资源优游率,擢升了摆布效能。
而推理民众( 具备推理才调的 AI 系统或算法,能够通过数据分析得出论断 )的负载平衡就更神秘了,一般的大模子,每次启动,必须把统共民众皆等比例放进工位( 显存 ),但真实复兴用户问题时,十几个民众内部只用到一两个,剩下的民众占着工位( 显存 )摸鱼,也干不了别的事情。
FP8 搀杂精度执行则是在之前被好多团队尝试无果的方进取拓展了新的一步,通过缩短执行精度以缩短执行时算力支拨,但却神奇地保持了复兴质料基本不变。
也恰是这些时期上的转变,才得回了大模子圈的一致好评。
通过一直以来的时期更新迭代, DeepSeek 成绩的讲演亦然相配惊东谈主的。
他们 V3 版块推出后,他们的价钱照旧是低到百万次几毛钱、几块钱。
他们以至还在搞了个新品促销当作,到来岁 2 月 8 号之前,在正本廉价的基础上再打折。
而一启动提到通常开源的 Claude 3.5 Sonnet ,每百万输入输出,至少皆得要几十块以上。。。
更要命的是,这对 DeepSeek 来说照旧是老例套路了。
早在旧岁首,DeepSeek V2 模子发布后,就靠着一手廉价,被公共叫作念了AI界拼多多。
他们还进一步激勉了国内大模子公司的价钱战,诸如智谱、字节、阿里、百度、腾讯等大厂纷繁降价。
池光耀也告诉我们,他们公司早在旧年 6 、 7 月份就启动用上了 DeepSeek ,那时也有国内其他一些大模子厂商来找过他们。
更夸张的是,由于时期 “ 遥遥卓越 ” 带来的降本增效,哪怕 DeepSeek 卖得这样低廉,凭据他们首创东谈主梁文峰所说,他们公司照旧赢利的。。。是不是有种隔邻比亚迪搞 998 ,照样财报飘红的滋味了。
不外关于我们庸碌用户来说, DeepSeek 似乎也有点偏门了。
因为他的缔结主若是在推理、数学、代码场合,而多模态和一些文娱化的畛域不是他们的所长。
况且脚下,尽管 DeepSeek 说我方照旧赢利的,但他们团队上高下下皆有股极客味,是以他们的生意化比起其他厂商就有点弱了。
但岂论怎么说, DeepSeek 的告捷也评释了,在 AI 这个赛谈还存在的更多的可能。
按往日的暴露,思玩转 AI 后头莫得个金主爸爸砸钱买显卡,根底就玩不转。
但当今看起来,掌合手了算力并不一定即是掌合手了一切。
我们不妨期待下将来,更多的优化出现,让更多的小公司、初创企业皆能投入 AI 畛域,差评君总嗅觉,那才是真实的 AI 波澜才对。
撰文:八戒
剪辑:江江 & 面线
好意思编:焕妍
图片、尊府开始:
X DeepSeek 官网
暗涌:揭秘 DeepSeek:一个更极致的中国时期理思方针故事
上一篇:顶配15万多中大型车!标配L2+8155芯片,续航710公里,比A6L果然
下一篇:手机价钱战开打