داخل إنشاء DBRX، أقوى نموذج للذكاء الاصطناعي مفتوح المصدر في العالم

تكلنوجيا

داخل إنشاء DBRX، أقوى نموذج للذكاء الاصطناعي مفتوح المصدر في العالم


يوم الاثنين الماضي، شارك حوالي عشرة مهندسين ومديرين تنفيذيين في شركة علوم البيانات والذكاء الاصطناعي طوب البيانات اجتمعوا في غرف اجتماعات متصلة عبر Zoom لمعرفة ما إذا كانوا قد نجحوا في بناء قمة الذكاء الاصطناعي نموذج اللغة. لقد أمضى الفريق أشهرًا، وحوالي 10 ملايين دولار، في تدريب DBRX، أ نموذج لغة كبير مشابه في التصميم للذي خلفه OpenAI's ChatGPT. لكنهم لن يعرفوا مدى قوة ابتكارهم حتى تظهر نتائج الاختبارات النهائية لقدراته.

“لقد تجاوزنا كل شيء”، هذا ما قاله جوناثان فرانكل، كبير مهندسي الشبكات العصبية في Databricks وقائد الفريق الذي أنشأ DBRX، للفريق في النهاية، الذي استجاب له بالتصفيق والهتافات والرموز التعبيرية. عادة ما يتجنب فرانكل تناول الكافيين، لكنه كان يتناول رشفات من اللاتيه المثلج بعد قضاء الليل كله لكتابة النتائج.

ستقوم Databricks بإصدار DBRX بموجب ترخيص مفتوح المصدر، مما يسمح للآخرين بالبناء على عملها. شارك فرانكل البيانات التي توضح أنه عبر حوالي اثني عشر معيارًا أو نحو ذلك لقياس قدرة نموذج الذكاء الاصطناعي على الإجابة على أسئلة المعرفة العامة، وأداء فهم القراءة، وحل الألغاز المنطقية المزعجة، وإنشاء تعليمات برمجية عالية الجودة، كان DBRX أفضل من أي نموذج آخر. نموذج مفتوح المصدر متاح.

أربعة أشخاص يقفون عند زاوية جدار رمادي وأصفر في مساحة مكتبية

صناع القرار في الذكاء الاصطناعي: جوناثان فرانكل، نافين راو، علي قدسي، وهانلين تانغ.الصورة: غابرييلا حسبون

لقد تفوقت ميتا لاما 2 وMistral's Mixtral، وهما من الأكثر شعبية نماذج الذكاء الاصطناعي مفتوحة المصدر المتاحة اليوم. “نعم!” صاح علي قدسي، الرئيس التنفيذي لشركة Databricks، عندما ظهرت النتائج. “انتظر، هل تغلبنا على أمر إيلون؟” أجاب فرانكل بأنهم تجاوزوا بالفعل نموذج Grok AI تم فتحه مؤخرًا بواسطة Musk's xAIمضيفًا: «سأعتبره نجاحًا إذا حصلنا على تغريدة خبيثة منه».

ولمفاجأة الفريق، كان DBRX أيضًا، في عدة درجات، قريبًا بشكل صادم من GPT-4، وهو نموذج OpenAI المغلق الذي يشغل ChatGPT ويعتبر على نطاق واسع قمة الذكاء الآلي. قال فرانكل بابتسامة عريضة: “لقد وضعنا مستوىً جديدًا من التقدم لحاملي شهادة LLM مفتوحة المصدر”.

اللبنات

ومن خلال المصادر المفتوحة، تضيف DBRX Databricks المزيد من الزخم إلى الحركة التي تتحدى النهج السري لأبرز الشركات في طفرة الذكاء الاصطناعي التوليدية الحالية. تحتفظ شركة OpenAI وGoogle برمز نماذج اللغات الكبيرة GPT-4 وGemini بشكل وثيق، لكن بعض المنافسين، ولا سيما ميتا، أطلقوا نماذجهم ليستخدمها الآخرون، بحجة أن ذلك سيحفز الابتكار من خلال وضع التكنولوجيا في أيدي المزيد من الباحثين ورجال الأعمال والشركات الناشئة والشركات القائمة.

وتقول Databricks إنها تريد أيضًا الانفتاح بشأن العمل المتضمن في إنشاء نموذجها مفتوح المصدر، وهو الأمر الذي لم تفعله Meta في ما يتعلق ببعض التفاصيل الأساسية حول إنشاء نموذجها مفتوح المصدر. نموذج لاما 2. ستقوم الشركة بإصدار منشور مدونة يوضح بالتفصيل العمل المطلوب لإنشاء النموذج، كما دعت WIRED أيضًا لقضاء بعض الوقت مع مهندسي Databricks حيث اتخذوا قرارات رئيسية خلال المراحل النهائية من عملية تدريب DBRX التي تبلغ تكلفتها ملايين الدولارات. لقد قدم ذلك لمحة عن مدى التعقيد والتحدي الذي يمثله بناء نموذج رائد للذكاء الاصطناعي – ولكن أيضًا كيف تبشر الابتكارات الحديثة في هذا المجال بخفض التكاليف. ويشير ذلك، إلى جانب توفر نماذج مفتوحة المصدر مثل DBRX، إلى أن تطوير الذكاء الاصطناعي ليس على وشك التباطؤ في أي وقت قريب.

علي فرهادي، الرئيس التنفيذي لشركة معهد ألين للذكاء الاصطناعييقول إن هناك حاجة ماسة إلى قدر أكبر من الشفافية حول بناء نماذج الذكاء الاصطناعي وتدريبها. أصبح هذا المجال سريًا بشكل متزايد في السنوات الأخيرة حيث سعت الشركات إلى التفوق على المنافسين. ويقول إن العتامة مهمة بشكل خاص عندما يكون هناك قلق بشأن المخاطر التي قد تشكلها نماذج الذكاء الاصطناعي المتقدمة. يقول فرهادي: “أنا سعيد جدًا برؤية أي جهد في الانفتاح”. “أعتقد أن جزءًا كبيرًا من السوق سوف يتجه نحو النماذج المفتوحة. نحن بحاجة إلى المزيد من هذا.”



Source link

Back To Top