تأیید متخصص
جیم فن، مدیر ارشد تحقیقات NVIDIA، اخیراً ارزیابی عمیق خود از DeepSeek R1 را در رسانههای اجتماعی به اشتراک گذاشت. به عنوان همبنیانگذار GEAR Lab، رهبر پروژه GR00T، دکترای استنفورد و اولین کارآموز OpenAI، دیدگاههای فن در صنعت وزن قابل توجهی دارد. او بهویژه بر مشارکتهای برجسته DeepSeek در توسعه هوش مصنوعی متنباز به عنوان یک شرکت غیر آمریکایی تأکید کرد.
وارث روح متنباز
فن در نظر خود اشاره کرد: "ما در زمان جالبی زندگی میکنیم که یک شرکت غیر آمریکایی مأموریت اصلی OpenAI را حفظ میکند - تحقیقات واقعاً باز و پیشرو که به همه قدرت میدهد. این ممکن است غیرمنطقی به نظر برسد، اما نتیجه سرگرمکنندهتر اغلب محتملترین است." او بهویژه قدردان این بود که DeepSeek نه تنها مجموعهای از مدلهای متنباز را منتشر میکند، بلکه تمام اسرار آموزش را نیز فاش میکند.
تحلیل عمیق نوآوریهای فنی
پس از مطالعه دقیق مقاله فنی DeepSeek R1، فن چندین پیشرفت فنی کلیدی را برجسته کرد:
-
رویکرد یادگیری تقویتی خالص:
- از روش "شروع سرد" استفاده میکند که فقط توسط RL هدایت میشود، بدون هیچ SFT
- یادآور پیشرفت AlphaZero در تسلط بر Go، شوگی و شطرنج از صفر است
- به عنوان مهمترین یافته مقاله در نظر گرفته میشود
-
مکانیسم پاداش نوآورانه:
- از پاداشهای واقعی محاسبه شده توسط قوانین کدگذاری شده استفاده میکند
- از مدلهای پاداش آموخته شده که RL میتواند به راحتی هک کند، اجتناب میکند
-
تکامل زمان تفکر:
- زمان تفکر مدل با پیشرفت آموزش به طور مداوم افزایش مییابد
- این یک ویژگی نوظهور است، نه یک رفتار از پیش برنامهریزی شده
-
نوآوری الگوریتم GRPO:
- شبکه منتقد را از PPO حذف میکند
- به جای آن از میانگین پاداش چندین نمونه استفاده میکند
- روشی ساده برای کاهش استفاده از حافظه
- قابل توجه است که GRPO در فوریه 2024 توسط DeepSeek اختراع شد
پارادایم جدید تأثیر فنی
فن بهطور خاص اشاره کرد که تأثیر در هوش مصنوعی میتواند به روشهای مختلفی حاصل شود: "تأثیر میتواند از طریق 'ASI داخلی محقق شده' یا نامهای اسطورهای مانند 'پروژه Strawberry' به دست آید. تأثیر همچنین میتواند به سادگی با انتشار الگوریتمهای خام و منحنیهای یادگیری matplotlib حاصل شود." این دیدگاه بر اهمیت باز بودن و شفافیت تأکید میکند.
نمونه نوآوری پایدار
از نظر فن، DeepSeek احتمالاً اولین پروژه متنباز است که رشد مهم و پایدار چرخ طیار RL را نشان میدهد. این پیشرفت فنی مداوم و نگرش باز، معیار مهمی برای کل جامعه هوش مصنوعی تعیین میکند.
نتیجهگیری
ارزیابی جیم فن نه تنها دستاوردهای فنی DeepSeek R1 را تأیید میکند، بلکه بر مشارکتهای مهم آن در دموکراتیزه کردن هوش مصنوعی و روح متنباز نیز تأکید میکند. به عنوان یک مرجع در صنعت، شناخت او جایگاه مهم DeepSeek را در چشمانداز جهانی هوش مصنوعی بیشتر تأیید میکند.
برای کشف نوآوریهای DeepSeek R1 به صورت شخصی، از DeepSeek R1 Chat بازدید کنید.