اعتراف الخبراء
شارك جيم فان، مدير الأبحاث الأول في NVIDIA، مؤخراً تقييمه المتعمق لـ DeepSeek R1 على وسائل التواصل الاجتماعي. بصفته المؤسس المشارك لـ GEAR Lab، وقائد مشروع GR00T، وحاصل على دكتوراه من ستانفورد، وأول متدرب في OpenAI، تحمل وجهات نظر فان وزناً كبيراً في الصناعة. وقد أكد بشكل خاص على مساهمات DeepSeek البارزة في تطوير الذكاء الاصطناعي مفتوح المصدر كشركة غير أمريكية.
وريث روح المصدر المفتوح
في تعليقه، أشار فان: "نحن نعيش في عصر مثير للاهتمام حيث تحافظ شركة غير أمريكية على المهمة الأصلية لـ OpenAI - بحث حقيقي مفتوح ومتقدم يمكّن الجميع. قد يبدو هذا غير منطقي، لكن النتيجة الأكثر إمتاعاً غالباً ما تكون الأكثر احتمالاً." وقد قدّر بشكل خاص أن DeepSeek لا تقوم فقط بإصدار سلسلة من النماذج مفتوحة المصدر، بل تكشف أيضاً عن جميع أسرار التدريب.
تحليل عميق للابتكارات التقنية
بعد قراءة متأنية للورقة التقنية لـ DeepSeek R1، أبرز فان عدة اختراقات تقنية رئيسية:
-
نهج التعلم المعزز الخالص:
- يستخدم طريقة "البدء البارد"، مدفوعة بالتعلم المعزز فقط، دون أي SFT
- يذكرنا باختراق AlphaZero في إتقان لعبة Go والشوغي والشطرنج من الصفر
- يعتبر أهم اكتشاف في الورقة
-
آلية المكافأة المبتكرة:
- يستخدم مكافآت حقيقية محسوبة بقواعد مشفرة
- يتجنب نماذج المكافأة المتعلمة التي يمكن للتعلم المعزز اختراقها بسهولة
-
تطور وقت التفكير:
- يزداد وقت تفكير النموذج باطراد مع تقدم التدريب
- هذه خاصية ناشئة، وليست سلوكاً مبرمجاً مسبقاً
-
ابتكار خوارزمية GRPO:
- يزيل شبكة النقد من PPO
- يستخدم بدلاً من ذلك متوسط مكافأة عينات متعددة
- طريقة بسيطة لتقليل استخدام الذاكرة
- من الجدير بالذكر أن GRPO تم اختراعه بواسطة DeepSeek في فبراير 2024
نموذج جديد للتأثير التقني
أشار فان بشكل خاص إلى أن التأثير في الذكاء الاصطناعي يمكن تحقيقه بطرق مختلفة: "يمكن تحقيق التأثير من خلال 'ASI المحقق داخلياً' أو أسماء أسطورية مثل 'مشروع Strawberry'. يمكن أيضاً تحقيق التأثير ببساطة من خلال نشر الخوارزميات الخام ومنحنيات التعلم matplotlib." هذا المنظور يؤكد على أهمية الانفتاح والشفافية.
مثال على الابتكار المستدام
من وجهة نظر فان، قد يكون DeepSeek أول مشروع مفتوح المصدر يظهر نمواً كبيراً ومستداماً لعجلة التعلم المعزز. هذا التقدم التقني المستمر والموقف المنفتح يضعان معياراً مهماً لمجتمع الذكاء الاصطناعي بأكمله.
الخاتمة
تقييم جيم فان لا يؤكد فقط الإنجازات التقنية لـ DeepSeek R1، بل يؤكد أيضاً مساهماته المهمة في دمقرطة الذكاء الاصطناعي وروح المصدر المفتوح. كسلطة في الصناعة، يؤكد اعترافه أكثر على مكانة DeepSeek المهمة في مشهد الذكاء الاصطناعي العالمي.
لاستكشاف ابتكارات DeepSeek R1 بنفسك، قم بزيارة DeepSeek R1 Chat.