تكنولوجيا

ديب سيك تكشف النقاب عن نموذج V4 بميزات متطورة وتكلفة اقتصادية تنافسية

أعلنت شركة DeepSeek الصينية عن إطلاق نموذجها المتطور الجديد المعروف باسم DeepSeek-V4، والذي يجمع بين كفاءة تشغيل عالية وأداء متميز بتكلفة منخفضة، حيث يعتمد هذا النموذج على مفهوم المصادر المفتوحة، مما يتيح للمستخدمين فرصة واسعة لتعديله واستخدامه في مجالات متعددة.

يتميز DeepSeek-V4 بتصميم مبتكر يستند إلى بنية «الخبراء المتعددين»، حيث يحتوي الإصدار V4-Pro على نحو 1.6 تريليون متغير، مع تشغيل 49 مليارًا فقط عند الحاجة، في حين يأتي إصدار V4-Flash مزودًا بـ 284 مليار متغير مع تفعيل 13 مليارًا فقط، مما يسهم في تحسين كفاءة استهلاك الموارد.

يسمح هذا التصميم بالتركيز على الأجزاء الضرورية من النموذج بناءً على المهمة المطلوبة، مما يؤدي إلى فعالية كبيرة في استهلاك الطاقة والمعالجة دون المساس بالأداء. كلا الإصدارين يوفران إمكانية معالجة سياق يصل إلى مليون رمز، مما يمكّن المستخدمين من تحليل كميات ضخمة من البيانات دفعة واحدة، بما في ذلك قواعد البيانات الشاملة والأرشيفات النصية الطويلة.

يعتمد النموذج على بنية مطورة تستفيد من مجموعة من الابتكارات الهندسية، من أبرزها آلية الانتباه الهجينة التي تقوم بضغط المعلومات غير الأساسية، مما يساعد على التركيز على العناصر الأكثر أهمية. بجانب ذلك، تتضمن هذه التقنيات أيضًا تحسينات تساهم في استقرار النموذج وتسريع عملية التدريب.

تتجلى كفاءة النموذج في استهلاكه المنخفض للموارد، إذ يحتاج إلى 27% فقط من القدرة الحسابية و10% من الذاكرة مقارنة بالإصدارات السابقة. وفي المقابل، يسجل الإصدار Flash أرقاماً أفضل، حيث تنخفض متطلبات القدرة الحسابية إلى حوالي 10% والذاكرة إلى 7%، مما يبرز فعاليته العالية.

تم تدريب النموذج على أكثر من 32 تريليون رمز من البيانات عالية الجودة، وذلك ضمن عملية شاملة تعتمد على تدريب مختصين قبل دمجهم في نموذج موحد، مع توفير خيارات مختلفة للإستدلال، مما يحقق توازناً بين السرعة والدقة في الأداء.

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى