در ژانویه ۲۰۲۵، DeepSeek مدل Janus Pro را معرفی کرد که پیشرفتی فناورانه و مهم بر پایه مدل اصلی Janus با بهبودهای قابل توجه در عملکرد است. از طریق استراتژیهای بهینهسازی شده آموزش، دادههای آموزشی گستردهتر و مقیاسپذیری بیشتر مدل، Janus Pro به نتایج قابل توجهی هم در درک چندرسانهای و هم در تبدیل متن به تصویر دست یافته است.
طراحی معماری نوآورانه
برجستهترین ویژگی Janus Pro معماری رمزگذاری بصری جداسازی شده آن است:
در مقایسه با رمزگذارهای بصری سنتی تکگانه، Janus Pro از طراحی جداسازی شده استفاده میکند که امکان مدیریت بهتر وظایف درک و تولید را فراهم میکند. این طراحی معماری نوآورانه در زیر نشان داده شده است:
ارزیابی عملکرد
Janus Pro عملکرد استثنایی در چندین آزمون معیار نشان داده است:
| مدل | طول توالی | دقت درک چندرسانهای | امتیاز کیفیت تولید | |------|----------|------------------|------------------| | Janus-Pro-7B | 4096 | 84.5% | 8.7/10 | | Janus-Pro-1B | 4096 | 82.3% | 8.4/10 | | Janus-1.3B | 4096 | 79.1% | 8.1/10 |
توزیع عملکرد مدل در وظایف مختلف:
کاربردهای عملی
درک فرمولهای ریاضی
Janus Pro در درک و تبدیل فرمولهای ریاضی پیچیده برتری دارد:
قابلیتهای تولید بصری
مدل قابلیتهای قدرتمند تولید تصویر را نشان میدهد و همه چیز را از آیکونهای ساده تا صحنههای پیچیده با دقت ارائه میکند:
اکوسیستم فنی
برای بهبود بیشتر قابلیتهای مدل، DeepSeek سیستم JanusFlow را معرفی کرده است:
JanusFlow با ادغام مدلهای زبانی خودرگرسیو با جریان اصلاحشده، امکانات جدیدی را برای پردازش چندرسانهای یکپارچه فراهم میکند.
متنباز و مجوز
DeepSeek اصول اشتراکگذاری باز را دنبال میکند و کد کامل در GitHub در دسترس است. استفاده از مدل تحت مجوز مدل DeepSeek است و از کاربردهای تجاری پشتیبانی میکند.
چشمانداز آینده
موفقیت Janus Pro نشاندهنده نقطه عطف مهمی در توسعه هوش مصنوعی چندرسانهای است. این مدل نه تنها عملکرد برجستهای ارائه میدهد، بلکه مسیر را برای تحقیقات و کاربردهای آینده نیز مشخص میکند. با ادامه پیشرفت فناوری، مشتاقانه منتظر دیدن کاربردهای نوآورانه بیشتر بر پایه Janus Pro هستیم.
برای اطلاعات بیشتر یا پشتیبانی فنی، لطفاً از وبسایت DeepSeek بازدید کنید یا با ما از طریق [email protected] تماس بگیرید.