أنفقت Databricks 10 ملايين دولار على نموذج الذكاء الاصطناعي التوليدي الجديد DBRX، لكنها لا تستطيع التغلب على GPT-4

تكلنوجيا

أنفقت Databricks 10 ملايين دولار على نموذج الذكاء الاصطناعي التوليدي الجديد DBRX، لكنها لا تستطيع التغلب على GPT-4


إذا كنت ترغب في رفع مستوى شركة التكنولوجيا الكبرى لديك وكان لديك 10 ملايين دولار لإنفاقها، فكيف ستنفقها؟ في إعلان سوبر بول؟ رعاية F1؟

أنت استطاع أنفقها في تدريب نموذج الذكاء الاصطناعي التوليدي. على الرغم من أنها ليست تسويقًا بالمعنى التقليدي، إلا أن النماذج التوليدية تجذب الانتباه – وتوجه بشكل متزايد إلى منتجات وخدمات البائعين الأساسية.

شاهد DBRX من Databricks، وهو نموذج جديد للذكاء الاصطناعي تم الإعلان عنه اليوم وهو مشابه لـ سلسلة GPT الخاصة بـ OpenAI و جوجل الجوزاء. متاح على GitHub ومنصة تطوير الذكاء الاصطناعي Hugging Face للبحث وكذلك للاستخدام التجاري، ويمكن تشغيل الإصدارات الأساسية (DBRX Base) والإصدارات المضبوطة بدقة (DBRX Instruct) من DBRX وضبطها على البيانات العامة أو المخصصة أو الخاصة.

قال نافين راو، نائب الرئيس للذكاء الاصطناعي التوليدي في Databricks، لـ TechCrunch في مقابلة: “تم تدريب DBRX ليكون مفيدًا ويقدم معلومات حول مجموعة واسعة من المواضيع”. “لقد تم تحسين DBRX وضبطه لاستخدام اللغة الإنجليزية، ولكنه قادر على التحدث والترجمة إلى مجموعة واسعة من اللغات، مثل الفرنسية والإسبانية والألمانية.”

تصف Databricks DBRX بأنه “مفتوح المصدر” بنفس الطريقة مثل النماذج “مفتوحة المصدر” مثل Meta's اللاما 2 وشركة ميسترال الناشئة للذكاء الاصطناعي عارضات ازياء. (إنه موضوع قوي مناظرة حول ما إذا كانت هذه النماذج تلبي بالفعل تعريف المصدر المفتوح.)

تقول شركة Databricks إنها أنفقت ما يقرب من 10 ملايين دولار وثمانية أشهر لتدريب DBRX، والتي تدعي (نقلًا عن بيان صحفي) أنها “تتفوق في الأداء”[s] جميع النماذج مفتوحة المصدر الحالية وفقًا للمعايير القياسية.

ولكن – وهنا تكمن المشكلة التسويقية – من الصعب للغاية استخدام DBRX إلا ​​إذا كنت أحد عملاء Databricks.

وذلك لأنه، من أجل تشغيل DBRX في التكوين القياسي، تحتاج إلى خادم أو كمبيوتر شخصي مزود بأربع وحدات معالجة رسوميات Nvidia H100 على الأقل. تكلف سيارة H100 الواحدة آلاف الدولارات، وربما أكثر. قد يكون هذا تغييرًا بسيطًا بالنسبة إلى مؤسسة عادية، ولكن بالنسبة للعديد من المطورين ورواد الأعمال المنفردين، فهو بعيد المنال.

وهناك طباعة جيدة للتمهيد. تقول شركة Databricks أن الشركات التي لديها أكثر من 700 مليون مستخدم نشط ستواجه “قيودًا معينة” قابلة للمقارنة إلى Meta's for Llama 2، وأنه سيتعين على جميع المستخدمين الموافقة على الشروط التي تضمن استخدامهم لـ DBRX “بشكل مسؤول”. (لم تتطوع Databricks بتفاصيل هذه المصطلحات حتى وقت النشر.)

تقدم Databricks منتج Mosaic AI Foundation Model الخاص بها كحل مُدار لهذه العوائق، والذي بالإضافة إلى تشغيل DBRX والنماذج الأخرى يوفر حزمة تدريب لضبط DBRX على البيانات المخصصة. يمكن للعملاء استضافة DBRX بشكل خاص باستخدام عرض تقديم نموذج Databricks، كما اقترح Rao، أو يمكنهم العمل مع Databricks لنشر DBRX على الأجهزة التي يختارونها.

وأضاف راو:

نحن نركز على جعل منصة Databricks الخيار الأفضل لبناء النماذج المخصصة، لذا فإن الفائدة التي تعود على Databricks في النهاية هي وجود عدد أكبر من المستخدمين على منصتنا. يعد DBRX بمثابة عرض توضيحي لمنصة التدريب المسبق والضبط الأفضل في فئتها، والتي يمكن للعملاء استخدامها لبناء نماذجهم الخاصة من الصفر. إنها طريقة سهلة للعملاء لبدء استخدام أدوات الذكاء الاصطناعي التوليدية Databricks Mosaic AI. ويتميز DBRX بقدرات عالية خارج الصندوق ويمكن ضبطه للحصول على أداء ممتاز في مهام محددة وباقتصاديات أفضل من النماذج الكبيرة المغلقة.

تدعي شركة Databricks أن DBRX يعمل بشكل أسرع بما يصل إلى 2x من Llama 2، ويرجع الفضل في ذلك جزئيًا إلى مزيجها من بنية الخبراء (MoE). MoE – التي تشترك فيها DBRX مع Llama 2، وأحدث موديلات Mistral، وGoogle التي تم الإعلان عنها مؤخرًا الجوزاء 1.5 برو – يقوم بشكل أساسي بتقسيم مهام معالجة البيانات إلى مهام فرعية متعددة ثم تفويض هذه المهام الفرعية إلى نماذج “خبراء” أصغر حجمًا ومتخصصة.

تضم معظم نماذج وزارة التربية والتعليم ثمانية خبراء. لدى DBRX 16، والتي تقول Databricks إنها تعمل على تحسين الجودة.

لكن الجودة نسبية.

بينما تدعي Databricks أن DBRX يتفوق على نماذج Llama 2 وMistral في بعض معايير فهم اللغة والبرمجة والرياضيات والمنطق، فإن DBRX لا يرقى إلى مستوى نموذج الذكاء الاصطناعي التوليدي الرائد، وهو OpenAI's GPT-4، في معظم المجالات خارج حالات الاستخدام المتخصصة مثل برمجة قواعد البيانات. جيل اللغة.

يعترف راو بأن DBRX لديه قيود أخرى أيضًا، أي أنه – مثل جميع نماذج الذكاء الاصطناعي التوليدي الأخرى – يمكن أن يقع ضحية “هلوسة” إجابات على الاستفسارات على الرغم من عمل Databricks في اختبار السلامة والفريق الأحمر. نظرًا لأن النموذج تم تدريبه ببساطة على ربط الكلمات أو العبارات بمفاهيم معينة، إذا لم تكن هذه الارتباطات دقيقة تمامًا، فلن تكون استجاباته دقيقة دائمًا.

كما أن DBRX ليس متعدد الوسائط، على عكس بعض نماذج الذكاء الاصطناعي التوليدية الرائدة الأحدث بما في ذلك Gemini. (يمكنه فقط معالجة وإنشاء النصوص، وليس الصور). ونحن لا نعرف بالضبط ما هي مصادر البيانات التي تم استخدامها لتدريبه؛ سيكشف راو فقط أنه لم يتم استخدام أي بيانات لعملاء Databricks في تدريب DBRX.

وأضاف: “لقد قمنا بتدريب DBRX على مجموعة كبيرة من البيانات من مجموعة متنوعة من المصادر”. “لقد استخدمنا مجموعات البيانات المفتوحة التي يعرفها المجتمع ويحبها ويستخدمها كل يوم.”

سألت Rao عما إذا كانت أي من مجموعات بيانات تدريب DBRX محمية بحقوق الطبع والنشر أو مرخصة، أو تظهر عليها علامات تحيز واضحة (على سبيل المثال التحيزات العنصرية)، لكنه لم يجب بشكل مباشر، واكتفى بالقول: “لقد كنا حذرين بشأن البيانات المستخدمة، وقمنا بإجراء تمارين الفريق الأحمر لتحسين نقاط الضعف في النموذج”. تميل نماذج الذكاء الاصطناعي التوليدية إلى اجتر تمثل بيانات التدريب مصدر قلق كبير للمستخدمين التجاريين للنماذج المدربة على بيانات غير مرخصة أو محمية بحقوق الطبع والنشر أو متحيزة بشكل واضح للغاية. في أسوأ السيناريوهات، يمكن أن ينتهي الأمر بالمستخدم في مأزق أخلاقي وقانوني بسبب دمجه عن غير قصد عملاً ينتهك حقوق الملكية الفكرية أو عملاً متحيزًا من نموذج ما في مشاريعه.

تقدم بعض الشركات التي تقوم بتدريب وإصدار نماذج الذكاء الاصطناعي التوليدية سياسات تغطي الرسوم القانونية الناشئة عن الانتهاك المحتمل. لا تقوم شركة Databricks بذلك في الوقت الحاضر – يقول راو إن الشركة “تستكشف السيناريوهات” التي يمكن بموجبها القيام بذلك.

بالنظر إلى هذا والجوانب الأخرى التي يفتقد فيها DBRX العلامة، يبدو النموذج وكأنه عملية بيع صعبة لأي شخص باستثناء عملاء Databricks الحاليين أو المحتملين. يقدم منافسو Databricks في مجال الذكاء الاصطناعي التوليدي، بما في ذلك OpenAI، تقنيات متساوية إن لم تكن أكثر إقناعًا وبأسعار تنافسية للغاية. والعديد من نماذج الذكاء الاصطناعي التوليدية تقترب من التعريف الشائع للمصدر المفتوح أكثر من DBRX.

يعد Rao بأن Databricks ستستمر في تحسين DBRX وإصدار إصدارات جديدة حيث يقوم فريق البحث والتطوير التابع لشركة Mosaic Labs – الفريق الذي يقف وراء DBRX – بالتحقق من طرق الذكاء الاصطناعي التوليدية الجديدة.

وقال: “تعمل DBRX على دفع مساحة النماذج مفتوحة المصدر إلى الأمام وتتحدى بناء النماذج المستقبلية بشكل أكثر كفاءة”. “سنقوم بإصدار متغيرات بينما نطبق تقنيات لتحسين جودة المخرجات من حيث الموثوقية والسلامة والتحيز… نحن نرى النموذج المفتوح كمنصة يمكن لعملائنا من خلالها بناء قدرات مخصصة باستخدام أدواتنا.”

إذا حكمنا من خلال مكانة DBRX الآن بالنسبة إلى أقرانها، فهو طريق طويل للغاية للأمام.



Source link

Back To Top