ثورة في نماذج الذكاء الاصطناعي مفتوحة المصدر

الرئيسية » إبداع وتنمية » ثورة في نماذج الذكاء الاصطناعي مفتوحة المصدر

ثورة في نماذج الذكاء الاصطناعي مفتوحة المصدر

أعلنت شركة DeepSeek الصينية المتخصصة في مجال الذكاء الاصطناعي إطلاق نموذجها الجديد DeepSeek-V3، الذي يُعدّ من أقوى النماذج المفتوحة المصدر في العالم.

ويعتمد النموذج على تقنية جديدة تُطلق عليها الشركة اسم Mixture-of-Experts أو اختصارًا (MoE) ويضم النموذج 671 مليار معلَمة مع تفعيل 37 مليار معلَمة لكل إدخال نصي، وتُعد المَعلَمات (Parameters) وسيلة لقياس كفاءة النماذج وقوتها.

ووفقًا لاختبارات الأداء القياسية للذكاء الاصطناعي، فقد أثبت النموذج الجديد تفوقه على نماذج شهيرة مغلقة المصدر مثل جي بيت تي 04 من أوبن إيه آي وكلاود 3.0 من شركة أنثروبيك، كما حقق هذا النموذج نتائج رائدة في تسعة معايير أداء رئيسية، متفوقًا على كافة النماذج الأخرى من الفئة نفسها.

ويحتاج النموذج الجديد إلى 2.8 مليون ساعة تدريب باستخدام وحدات معالجة الرسوميات H800، بتكلفة تُقدَّر بنحو 5.6 مليون دولار. وللمقارنة، فإن نموذج Llama 3  من ميتا (405 مليارات مَعلَمة) يحتاج إلى 30.8 مليون ساعة تدريب، ويُعزى انخفاض التكلفة إلى دعم تقنية متطورة في النموذج، وإجراء تحسينات هندسية عميقة.

وفيما يخص التشغيل، يقدم DeepSeek-V3 كفاءة استثنائية؛ إذ إن تكلفة الإدخال في هذا النموذج أقل بعشر مرات من تكلفة النماذج الرائدة الأخرى، مثل تلك التي تقدمها أوبن إيه آي.

وفي بيانٍ عبر منصة إكس، أعرب الفريق المطور عن تفاؤله بالإنجاز الجديد، مشيرًا إلى أن هذا النموذج يشكّل خطوة نحو تقليص الفجوة بين النماذج المفتوحة والمغلقة.

ويُعدّ هذا الإصدار خطوة هامة نحو إتاحة الوصول إلى تقنيات الذكاء الاصطناعي المتقدمة على نطاق عالمي دون أن تكون متاحة حصريًا لشركات أو دول بعينها.

العرب

شارك:

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *