DeepSeek Janus Pro: 突破性统一多模态AI模型

DeepSeek于2025年1月发布了Janus Pro，这是一个重要的技术突破，它在原有Janus模型的基础上实现了显著的性能提升。通过优化训练策略、扩充训练数据以及扩展模型规模，Janus Pro在多模态理解和文本到图像生成方面都取得了卓越的成果。

创新架构设计

Janus Pro最显著的特点是其解耦的视觉编码架构：

视觉编码对比

与传统的单一视觉编码器相比，Janus Pro采用解耦设计，使模型能够更好地处理理解和生成任务。这种创新的架构设计如下图所示：

Janus Pro架构

性能评估

在多项基准测试中，Janus Pro展现出了优异的性能：

| 模型 | 序列长度 | 多模态理解准确率 | 图像生成质量评分 | |------|----------|------------------|------------------| | Janus-Pro-7B | 4096 | 84.5% | 8.7/10 | | Janus-Pro-1B | 4096 | 82.3% | 8.4/10 | | Janus-1.3B | 4096 | 79.1% | 8.1/10 |

模型在各个任务上的分布表现：

性能分布