تدعي شركة Anthropic أن نماذجها الجديدة تتفوق على GPT-4

تكلنوجيا

تدعي شركة Anthropic أن نماذجها الجديدة تتفوق على GPT-4


شركة ناشئة للذكاء الاصطناعي أنثروبي، بدعم من مئات الملايين في رأس المال الاستثماري (وربما قريبا مئات الملايين آخرين)، اليوم أعلن أحدث نسخة من تقنية GenAI، كلود. وتدعي الشركة أنها تنافس OpenAI جي بي تي-4 من حيث الأداء.

Claude 3، كما يُطلق على GenAI الجديد لشركة Anthropic، هي عائلة من العارضات – Claude 3 Haiku، وClaude 3 Sonnet، وClaude 3 Opus، ويعتبر Opus هو الأقوى. تُظهِر جميعها “قدرات متزايدة” في التحليل والتنبؤ، والادعاءات الإنسانية، فضلاً عن الأداء المعزز في معايير محددة مقابل نماذج مثل GPT-4 (ولكن ليس جي بي تي-4 توربو) وجوجل الجوزاء 1.0 الترا (لكن لا الجوزاء 1.5 برو).

والجدير بالذكر أن Claude 3 هو أول GenAI متعدد الوسائط من Anthropic، مما يعني أنه يمكنه تحليل النص وكذلك الصور – على غرار بعض النكهات جي بي تي-4 و تَوأَم. يستطيع Claude 3 معالجة الصور والمخططات والرسوم البيانية والرسوم البيانية الفنية، والرسم من ملفات PDF وعروض الشرائح وأنواع المستندات الأخرى.

في خطوة واحدة أفضل من بعض منافسي GenAI، يستطيع Claude 3 تحليل صور متعددة في طلب واحد (بحد أقصى 20). وهذا يسمح لها بمقارنة الصور وتباينها، كما يشير الأنثروبي.

لكن هناك حدودًا لمعالجة صور كلود 3.

لقد عطلت الأنثروبيك النماذج من التعرف على الأشخاص – ولا شك أنها حذرة من الآثار الأخلاقية والقانونية. وتعترف الشركة بأن كلود 3 عرضة لارتكاب أخطاء في الصور “منخفضة الجودة” (أقل من 200 بكسل) ويواجه صعوبة في المهام التي تنطوي على التفكير المكاني (مثل قراءة وجه الساعة التناظرية) وعد الأشياء (لا يستطيع كلود 3 إعطاء معلومات دقيقة) عدد الكائنات في الصور).

الأنثروبي كلود 3

اعتمادات الصورة: أنثروبي

كلود 3 لن يفعل ذلك أيضًا يولد عمل فني. تقوم النماذج بتحليل الصور بشكل صارم، على الأقل في الوقت الحالي.

سواء أكان إرسال نص أو صور، تقول Anthropic أنه يمكن للعملاء عمومًا أن يتوقعوا من Claude 3 اتباع التعليمات متعددة الخطوات بشكل أفضل، وإنتاج مخرجات منظمة بتنسيقات مثل JSON والتحدث بلغات غير الإنجليزية مقارنة بسابقاتها. تقول أنثروبيك إنه يجب على كلود 3 أيضًا أن يرفض الإجابة على الأسئلة بشكل أقل بفضل “فهم أكثر دقة للطلبات”. وقريبًا، ستذكر العارضات مصدر إجاباتهن على الأسئلة حتى يتمكن المستخدمون من التحقق منها.

“يميل كلود 3 إلى توليد استجابات أكثر تعبيراً وجاذبية”، كتب أنثروبيك في مقالة دعم. “[It’s] أسهل في التوجيه والتوجيه مقارنة بنماذجنا القديمة. يجب أن يجد المستخدمون أنه يمكنهم تحقيق النتائج المرجوة من خلال مطالبات أقصر وأكثر إيجازًا.

تنبع بعض هذه التحسينات من السياق الموسع لكلود 3.

يشير سياق النموذج، أو نافذة السياق، إلى بيانات الإدخال (مثل النص) التي يأخذها النموذج في الاعتبار قبل إنشاء المخرجات. تميل النماذج ذات نوافذ السياق الصغيرة إلى “نسيان” محتوى المحادثات الحديثة جدًا، مما يؤدي بها إلى الانحراف عن الموضوع – غالبًا بطرق إشكالية. وكجانب إيجابي إضافي، يمكن لنماذج السياق الكبير فهم التدفق السردي للبيانات التي تستقبلها بشكل أفضل وتوليد استجابات أكثر ثراءً من حيث السياق (من الناحية النظرية، على الأقل).

تقول Anthropic أن Claude 3 سيدعم في البداية نافذة سياق مكونة من 200000 رمز مميز، أي ما يعادل حوالي 150000 كلمة، مع حصول عملاء محددين على نافذة سياق مكونة من مليون رمز مميز (حوالي 700000 كلمة). وهذا يتساوى مع أحدث طراز GenAI من Google، وهو Gemini 1.5 Pro المذكور أعلاه، والذي يوفر أيضًا ما يصل إلى مليون نافذة سياقية.

الآن، لمجرد أن Claude 3 عبارة عن ترقية لما جاء قبله، فهذا لا يعني أنه مثالي.

في التقنية ورق ابيض، تعترف الأنثروبيك بأن كلود 3 ليس محصنًا ضد المشكلات التي تعاني منها نماذج GenAI الأخرى، وهي التحيز والتحيز. الهلوسة (أي صنع الأشياء). على عكس بعض نماذج GenAI، لا يستطيع كلود 3 البحث في الويب؛ لا يمكن للنماذج الإجابة إلا على الأسئلة باستخدام البيانات التي تعود إلى ما قبل أغسطس 2023. وعلى الرغم من أن كلود متعدد اللغات، إلا أنه لا يجيد بعض اللغات “منخفضة الموارد” مقارنة باللغة الإنجليزية.

لكن تحديثات Anthropic الواعدة المتكررة لكلود 3 في الأشهر القادمة.

“لا نعتقد أن الذكاء النموذجي يقترب من حدوده بأي حال من الأحوال، ونحن نخطط لإصداره [enhancements] إلى عائلة طرازات Claude 3 خلال الأشهر القليلة المقبلة مشاركة مدونة.

Opus وSonnet متاحان الآن على الويب وعبر وحدة تحكم Anthropic's dev وواجهة برمجة التطبيقات (API) التابعة لـ Amazon حجر الأساس منصة وجوجل فيرتكس الذكاء الاصطناعي. وسوف يتبع هايكو في وقت لاحق من هذا العام.

إليك تفاصيل الأسعار:

  • Opus: 15 دولارًا لكل مليون رمز إدخال، و75 دولارًا لكل مليون رمز إخراج
  • Sonnet: 3 دولارات لكل مليون رمز إدخال، و15 دولارًا لكل مليون رمز إخراج
  • هايكو: 0.25 دولار لكل مليون رمز إدخال، و1.25 دولار لكل مليون رمز إخراج

إذن هذا هو كلود 3. لكن ما هو المنظر من ارتفاع 30 ألف قدم لكل هذا؟

حسنا، كما فعلنا ذكرت في السابق، كان طموح Anthropic هو إنشاء خوارزمية من الجيل التالي لـ “التعليم الذاتي للذكاء الاصطناعي”. يمكن استخدام مثل هذه الخوارزمية لبناء مساعدين افتراضيين يمكنهم الرد على رسائل البريد الإلكتروني وإجراء الأبحاث وإنشاء أعمال فنية وكتب وغير ذلك الكثير – وقد تذوقنا بعضها بالفعل مع أمثال جي بي تي-4 وغيرها من نماذج اللغات الكبيرة.

تلمح Anthropic إلى ذلك في منشور المدونة المذكور أعلاه، قائلة إنها تخطط لإضافة ميزات إلى Claude 3 تعمل على تعزيز قدراتها خارج البوابة من خلال السماح لـ Claude بالتفاعل مع الأنظمة الأخرى، والبرمجة “بشكل تفاعلي” وتوفير “قدرات وكيلة متقدمة” “.

هذا الجزء الأخير يدعو إلى الأذهان OpenAI ذكرت طموحات لبناء وكيل برمجي لأتمتة المهام المعقدة، مثل نقل البيانات من مستند إلى جدول بيانات أو ملء تقارير النفقات تلقائيًا وإدخالها في برامج المحاسبة. OpenAI بالفعل عروض واجهة برمجة تطبيقات تسمح للمطورين ببناء “تجارب شبيهة بالوكيل” في تطبيقاتهم، ويبدو أن Anthropic عازمة على تقديم وظائف قابلة للمقارنة.

هل يمكننا رؤية مولد صور من Anthropic بعد ذلك؟ سيفاجئني ذلك بصراحة. أصبحت مولدات الصور موضوعًا للكثير من الجدل هذه الأيام، وذلك لأسباب تتعلق بحقوق الطبع والنشر والتحيز بشكل أساسي. اضطرت جوجل مؤخرًا إلى ذلك إبطال منشئ الصور الخاص بها بعد أن أدخل التنوع في الصور مع تجاهل هزلي للسياق التاريخي. ويوجد عدد من بائعي مولدات الصور معارك قانونية مع الفنانين الذين يتهمونهم بالتربح من عملهم من خلال تدريب GenAI على هذا العمل دون تقديم تعويض أو حتى ائتمان.

أشعر بالفضول لرؤية تطور تقنية Anthropic لتدريب GenAI، “منظمة العفو الدولية الدستورية“، والذي تدعي الشركة أنه يجعل سلوك GenAI أسهل للفهم وأكثر قابلية للتنبؤ به وأسهل في التعديل حسب الحاجة. ويهدف الذكاء الاصطناعي الدستوري إلى توفير وسيلة ل مواءمة الذكاء الاصطناعي مع نوايا الإنسان، وجود نماذج تستجيب للأسئلة وتؤدي المهام باستخدام مجموعة بسيطة من المبادئ التوجيهية. على سبيل المثال، بالنسبة لـ Claude 3، قالت Anthropic إنها أضافت مبدأً – مستنيرًا بتعليقات التعهيد الجماعي – يوجه النماذج لتكون مفهومة للأشخاص ذوي الإعاقة ويمكن الوصول إليها.

مهما كانت نهاية لعبة الأنثروبيك، فهي موجودة على المدى الطويل. حسب وفقًا لما تم تسريبه في شهر مايو من العام الماضي، تهدف الشركة إلى جمع ما يصل إلى 5 مليارات دولار على مدار الـ 12 شهرًا القادمة أو نحو ذلك – وهو ما قد يكون مجرد خط الأساس الذي تحتاجه لتظل قادرة على المنافسة مع OpenAI. (نماذج التدريب ليست رخيصة، على أية حال.) إنها في طريقها إلى الأمام، مع 2 مليار دولار و4 مليارات دولار من رأس المال الملتزم به وتعهدات من جوجل وأمازون، على التوالي، وأكثر من مليار دولار مجتمعة من داعمين آخرين.



Source link

Back To Top