DeepSeek Janus Pro: 統合マルチモーダルAIにおけるブレークスルー

DeepSeekは2025年1月、従来のJanusモデルを大幅に改良したJanus Proをリリースしました。トレーニング戦略の最適化、トレーニングデータの拡充、モデル規模の拡大を通じて、Janus Proはマルチモーダル理解とテキストから画像生成の両面で卓越した成果を達成しました。

革新的なアーキテクチャ設計

Janus Proの最も顕著な特徴は、デカップルされた視覚エンコーディングアーキテクチャです：

視覚エンコーディングの比較

従来の単一視覚エンコーダと比較して、Janus Proはデカップル設計を採用し、理解と生成の両タスクをより効果的に処理できます。この革新的なアーキテクチャ設計は以下の図に示されています：

Janus Proアーキテクチャ

パフォーマンス評価

Janus Proは複数のベンチマークテストで優れたパフォーマンスを示しています：

| モデル | シーケンス長 | マルチモーダル理解精度 | 画像生成品質スコア | |------|----------|------------------|------------------| | Janus-Pro-7B | 4096 | 84.5% | 8.7/10 | | Janus-Pro-1B | 4096 | 82.3% | 8.4/10 | | Janus-1.3B | 4096 | 79.1% | 8.1/10 |

各タスクにおけるモデルのパフォーマンス分布：

パフォーマンス分布