DeepSeek-VL2 开源：AI视觉模子迈入 MoE 期间

发布日期：2025-01-12 05:39 点击次数：179

IT之家 12 月 14 日音问，DeepSeek 官方公众号昨日（12 月 13 日）发布博文，文书开源 DeepSeek-VL2 模子，在各项评测目的上均获得了极具上风的成绩，官方称其视觉模子认真迈入搀杂行家模子（Mixture of Experts，简称 MoE）期间。

IT之家征引官方新闻稿，附上 DeepSeek-VL2 亮点如下：

数据：比一代 DeepSeek-VL 多一倍优质考研数据，引入梗图联络、视觉定位、视觉故事生成等新智商

架构：视觉部分使用切图战略赞助动态分歧率图像，道话部分选拔 MoE 架构低资本高性能

考研：接收 DeepSeek-VL 的三阶段考研经过，同期通过负载平衡适配图像切片数目不定的穷困，对图像和文本数据使用不同活水并行战略，对 MoE 道话模子引入行家并行，结束高效考研

DeepSeek-VL2 模子赞助动态分歧率，仅使用一个 SigLIP-SO400M 四肢图像编码器，通过将图像切分为多张子图和一张全局缩略图来结束动态分歧率图像赞助。这一战略让 DeepSeek-VL2 最多赞助 1152x1152 的分歧率和 1:9 或 9:1 的极点长宽比，适配更多诈欺场景。

DeepSeek-VL2 模子还收货于更多科研文档数据的学习，不错松驰联络多样科研图表，并通过 Plot2Code，把柄图像生成 Python 代码。

模子和论文均已发布：

模子下载：https://huggingface.co/deepseek-ai

GitHub 主页：https://github.com/ deepseek-ai/DeepSeek-VL2

上一篇：广州培育24个跨境电商产业园

下一篇：ChatGPT终于也推出Projects功能，却专门披露一个“AGI”的样式