栏目分类
发布日期:2025-03-23 14:55 点击次数:163
IT之家 2 月 9 日音问,激越信息技能有限公司昨日晚发秘书示,旗下腾云 S5000C 和腾锐 D3000 收效终了对 DeepSeek 全系列大模子的端到端救助,隐敝数据中心和末端场景,土产货部署的推理恶果与海外同类家具架构处理决议非常。
据先容,DeepSeek-V2.5 236B 大模子于 2024 年在激越腾云 S5000C 平台终了巩固开动。基于激越腾云 S5000C 确立搭配 8 块国产 AI 卡,合座性能可达海外平台性能 80% 阁下。DeepSeek-V3 和 R1 版块发布后,激越技能团队在腾云 S5000C 平台和腾锐 D3000 上对其进行土产货部署考据,酿成合座处理决议。
数据中心侧,激越腾云 S5000C 处事器可与多款 AI 加快卡互助终了 DeepSeek 蒸馏版和全量版部署。激越 AI 履行室在单机 8 卡处事器平台已进行蒸馏版 DeepSeek-R1-Distill-Llama-70B 版块测试,推理速率可达 22tokens / s。完满版 DeepSeek R1 671B 模子摄取散播式推理框架,基于四机 32 卡 AI 处事器集群开动可部署收效。
用户末端侧,基于激越腾锐 D3000 的台式机不错土产货部署 DeepSeek-R1 7B 蒸馏版模子,搭配 1 张国产推理卡,终了 AI PC 才智。
IT之家附激越腾云 S5000C 和激越腾锐 D3000 两款 CPU 的主要信息如下:
腾云 S5000C激越腾云 S5000C 领有 64 核、32 核、16 核 3 种家具格局,兼容 ARMv8 辅导集,救助硬件编造化,家具救助贸易和工业分级,该家具主要面向盘算处事器、存储处事器、AI 处事器、高端网安、行业级业务主机处事器系统、大型互联网数据中心等场景。
激越腾锐 D3000 集成 8 个激越自主研发的新一代高性能处理器核 FTC862,兼容 64 位 ARMv8 辅导集并救助 ARM64 和 ARM32 两种实施模式,救助单精度、双精度浮点运算辅导和 ASIMD 处理辅导,主频达到 2.5GHz,救助硬件编造化,救助贸易和工业分级。
上一篇:掉进粮仓会怎样?海外改换粮仓机器东谈主,揭秘各类用途!
下一篇:绽开伙同才略照亮东谈主工智能将来