栏目分类
发布日期:2024-12-17 07:07 点击次数:148
今天下昼,一年一度的 Arm Tech Symposia 年度工夫大会在深圳圆满收敛。
Arm 在本次大会上长远考虑了 AI 对谋略的需求,并共享了怎样通过硬件、软件、生态系统三大中枢更好地把捏 AI 的发展机遇,在场与会者也共同考虑了基于 Arm 的工夫翻新和 AI 发展趋势。
Arm 终局行状部家具照管副总裁 James McNiven 在深圳场的大会主题演讲中强调,Armv9 行为 Arm 最新的工夫架构,推出开端即是为复古 AI 谋略而假想,并不时迭代更新,通过 SVE、SVE2、SME 等要津工夫,Arm 以架构翻新和巨大的软硬件协同才略不停优化挪动端 AI 体验,赋能斥地者收场超卓的 AI 性能。
在本次大会中,KleidiAI 软件是值得存眷的亮点之一。
它收场了与主流 AI 框架的深度集成,梗概为斥地者提供丝滑的斥地体验;当与 Arm CSS 搭配使用时,KleidiAI 通过整合 Neon™、SVE2 和 SME2 等一系列 Arm 加速工夫,从而权贵栽种谋略应用的性能阐扬。
据悉,KleidiAI 是一套挑升面向 AI 框架斥地者的高性能谋略内核。
它梗概匡助斥地者在多样设置上松驰阐扬 Arm CPU 上的最好性能,并充分愚弄 Neon、SVE2 和 SME2 等要津 Arm 架构的中枢特质。
此外,KleidiAI 还集成了 PyTorch、Tensorflow、MediaPipe 等热点 AI 框架,对 Meta Llama 3、Phi-3 等模子进行了性能优化,况且还聘用了可前后兼容的假想。
这么作念的自制是,确保 Arm 往时在引入更多工夫时已经能适用往时商场的需求。
据先容,KleidiAI 的集成权贵栽种了生成式 AI 的使命成果。
数据清醒,与参考收场决策(基于 llama.cpp,但不含 Kleidi 软件优化)比较,在新的 Arm Cortex-X925 CPU 上,使用(集成了 KleidiAI 的)llama.cpp 的 Meta Llama 3 和微软 Phi-3 大说念话模子 (LLM) 的词元 (Token) 初次反馈时刻加速了 190%。
KleidiAI 的另一大上风在于易于集成。
据悉,Arm 的工程团队只用不到 24 小时就完成了 Llama 3 的性能优化测试。
此外,KleidiAI 还通过 XNNPACK 与 MediaPipe 集成,为在挪动设置上起先的开源 Gemma LLM 提供赞助。收成于此,Google Pixel 8 Pro 智妙手机上 Gemma 2B 的词元初次反馈时刻裁汰了 25%。
与此同期,Arm 还与 Unity 妥洽斥地端侧 AI 推理引擎——Sentis,可让游戏斥地者在整个赞助 Unity 游戏引擎的设置上打造全新的 AI 游戏体验。
另外,行为迄今速率最快的 Arm 谋略平台,Arm 终局 CSS 在谋略和图形性能方面收场了逾越 30% 的栽种,足以搪塞各类严苛的 Android 使命负载。
与此同期,Arm 终局 CSS 也提高了 59% 的 AI 推理速率,适用于更平日的 AI/机器学习 (ML) 和谋略视觉使命负载。
Arm 终局 CSS 的中枢上风在于其搭载了 Arm 迄今性能最强、成果最高、功能最全面的 CPU 集群,接力于于收场性能与能效的最好均衡。
而凭借新一代 Arm Cortex®-X CPU,AI 优化的 Arm 终局 CSS 带来最高的 IPC 同比栽种,性能提高 36%;新的 Arm Immortalis™ GPU 的图形性能提高 37%。
Arm Immortalis-G925 GPU 是 Arm 性能最强、成果最高的 GPU,在多款手游应用中收场了 37% 的性能栽种,并在多个 AI 和 ML 集会上栽种了 34% 的性能。
Immortalis-G925 主要面向旗舰智妙手机商场。
而包括 Arm Mali™-G725 和 Mali-G625 GPU 在内的全新高可扩张性 GPU 系列,则面向从高端手机到智妙腕表和 XR 可衣服设置等平日的消耗电子设置商场。
Arm 展望到 2025 年底,公共将有逾越 1000 亿台具备 AI 才略的 Arm 设置。
从传感器、智妙手机,到工业物联网、汽车和数据中心,就像建造摩天大楼需要坚实的地基,AI 工夫的蕃昌发展也离不开巨大而高效的谋略平台行为复古。
凭借在芯片架构与工夫翻新上的不懈戮力,Arm 正在为这座「AI 摩天大楼」打造最可靠的基石,也将在这场工夫变革中演出愈发要津的扮装。