栏目分类
发布日期:2025-04-08 15:58 点击次数:148
IT之家 2 月 27 日音书,微软于 2024 年 12 月发布了 Phi-4,这是一款在同类居品中弘扬超卓的袖珍谈话模子(SLM)。当天,微软进一步彭胀 Phi-4 家眷,推出了两款全新模子:Phi-4 多模态(Phi-4-multimodal)和 Phi-4 迷你(Phi-4-mini)。
Phi-4 多模态模子是微软首款集谚语音、视觉和文本惩处的长入架构多模态谈话模子,参数目达 56 亿。在多项基准测试中,Phi-4 多模态的弘扬优于其他现存的先进全模态模子,举例谷歌的 Gemini 2.0 Flash 和 Gemini 2.0 Flash Lite。
在语音相干任务中,Phi-4 多模态在自动语音识别(ASR)和语音翻译(ST)方面卓绝了 WhisperV3 和 SeamlessM4T-v2-Large 等专科语音模子。微软示意,该模子在 Hugging Face OpenASR 排名榜上以 6.14% 的词差错率位居榜首。
在视觉相干任务中,Phi-4 多模态在数学和科学推理方面弘扬出色。在文档意会、图表意会、光学字符识别(OCR)和视觉科学推理等常见多模态智商方面,该模子与 Gemini-2-Flash-lite-preview 和 Claude-3.5-Sonnet 等流行模子相忘形甚而卓绝。
IT之家安祥到,Phi-4 迷你模子则专注于文本任务,参数目为 38 亿。其在文本推理、数学筹备、编程、领导革职和函数调用等任务中弘扬优异,卓绝了多款流行的大型谈话模子。
为确保新模子的安全性和可靠性,微软邀请了里面和外部安全众人进行测试,并给与了微软东说念主工智能红队(AIRT)制定的战略。过程进一步优化后,Phi-4 迷你和 Phi-4 多模态模子均可通过 ONNX Runtime 部署到开拓端,终了跨平台使用,适用于低资本和低延伸场景。
现在,Phi-4 多模态和 Phi-4 迷你模子已在 Azure AI Foundry、Hugging Face 和 NVIDIA API 目次中上线,供开拓者使用。
Phi-4 系列新模子的推出,标记着高效 AI 时间的环节向上,为各样东说念主工智能愚弄带来了盛大的多模态和文本惩处智商。