DeepSeek Janus Pro: 突破性統一多模態AI模型

DeepSeek於2025年1月發布了Janus Pro，這是一個重要的技術突破，它在原有Janus模型的基礎上實現了顯著的性能提升。通過優化訓練策略、擴充訓練數據以及擴展模型規模，Janus Pro在多模態理解和文本到圖像生成方面都取得了卓越的成果。

創新架構設計

Janus Pro最顯著的特點是其解耦的視覺編碼架構：

視覺編碼對比

與傳統的單一視覺編碼器相比，Janus Pro採用解耦設計，使模型能夠更好地處理理解和生成任務。這種創新的架構設計如下圖所示：

Janus Pro架構

性能評估

在多項基準測試中，Janus Pro展現出了優異的性能：

| 模型 | 序列長度 | 多模態理解準確率 | 圖像生成質量評分 | |------|----------|------------------|------------------| | Janus-Pro-7B | 4096 | 84.5% | 8.7/10 | | Janus-Pro-1B | 4096 | 82.3% | 8.4/10 | | Janus-1.3B | 4096 | 79.1% | 8.1/10 |

模型在各個任務上的分布表現：

性能分布