تطلق Microsoft أداة إنشاء التزييف العميق في حدث Ignite 2023

تكلنوجيا

تطلق Microsoft أداة إنشاء التزييف العميق في حدث Ignite 2023


أحد المنتجات غير المتوقعة التي تم إطلاقها من حدث مايكروسوفت إجنايت 2023 هي أداة يمكنها إنشاء صورة رمزية واقعية لشخص ما وتحريك تلك الصورة الرمزية وهي تقول أشياء لم يقلها الشخص بالضرورة.

تتيح الميزة الجديدة التي يطلق عليها Azure AI Speech text to الكلام الرمزي، وهي متاحة في المعاينة العامة اعتبارًا من اليوم، للمستخدمين إنشاء مقاطع فيديو لصورة رمزية تتحدث عن طريق تحميل صور لشخص يرغبون في أن تشبهه الصورة الرمزية وكتابة نص. تقوم أداة ميكروسوفت بتدريب نموذج لتشغيل الرسوم المتحركة، في حين يقوم نموذج منفصل لتحويل النص إلى كلام – سواء تم إنشاؤه مسبقًا أو تم تدريبه على صوت الشخص – “بقراءة” النص بصوت عالٍ.

“باستخدام الصورة الرمزية لتحويل النص إلى كلام، يمكن للمستخدمين إنشاء مقاطع فيديو بكفاءة أكبر… لإنشاء مقاطع فيديو تدريبية ومقدمات عن المنتجات وشهادات العملاء [and so on] ببساطة مع إدخال النص،” يكتب مايكروسوفت في منشور مدونة. “يمكنك استخدام الصورة الرمزية لإنشاء وكلاء محادثة ومساعدين افتراضيين وروبوتات دردشة والمزيد.”

يمكن للصور الرمزية التحدث بلغات متعددة. وبالنسبة لسيناريوهات روبوتات الدردشة، يمكنهم الاستفادة من نماذج الذكاء الاصطناعي مثل OpenAI’s GPT-3.5 للرد على الأسئلة الخارجة عن النص من العملاء.

الآن، هناك عدد لا يحصى من الطرق التي يمكن من خلالها إساءة استخدام مثل هذه الأداة، وهو ما تدركه شركة مايكروسوفت. (كانت هناك تقنية مماثلة لإنشاء الصور الرمزية من شركة Synthesia الناشئة للذكاء الاصطناعي يساء استخدامها لإنتاج الدعاية في فنزويلا و خطأ شنيع التقارير الإخبارية التي تروج لها حسابات وسائل التواصل الاجتماعي المؤيدة للصين.) لن يتمكن معظم مشتركي Azure من الوصول إلا إلى الصور الرمزية المعدة مسبقًا – وليس المخصصة – عند الإطلاق؛ تقول Microsoft إن الصور الرمزية المخصصة هي حاليًا إمكانية “وصول محدود” متاحة عن طريق التسجيل فقط و”لحالات استخدام معينة فقط”.

لكن هذه الميزة تثير مجموعة من الأسئلة الأخلاقية غير المريحة.

كانت إحدى النقاط الشائكة الرئيسية في إضراب SAG-AFTRA الأخير هي استخدام الذكاء الاصطناعي لإنشاء أشكال رقمية. وافقت الاستوديوهات في النهاية على دفع أجور للممثلين مقابل التشابهات التي أنشأها الذكاء الاصطناعي. ولكن ماذا عن مايكروسوفت وعملائها؟

لقد سألت مايكروسوفت عن موقفها من الشركات التي تستخدم صور الممثلين دون الحصول على تعويض مناسب أو حتى إشعار، في نظر الممثلين. لم تستجب الشركة – ولم تذكر ما إذا كانت ستتطلب من الشركات تصنيف الصور الرمزية على أنها تم إنشاؤها بواسطة الذكاء الاصطناعي، مثل موقع YouTube و أ عدد متزايد من منصات أخرى.

صوت شخصي

يبدو أن Microsoft لديها المزيد من الحواجز حول أداة الذكاء الاصطناعي ذات الصلة، وهي الصوت الشخصي، والتي يتم إطلاقها أيضًا في Ignite.

يمكن للصوت الشخصي، وهو قدرة جديدة ضمن خدمة الصوت العصبي المخصصة من Microsoft، تكرار صوت المستخدم في بضع ثوانٍ بشرط تقديم عينة من الكلام مدتها دقيقة واحدة كمطالبة صوتية. تطرحها Microsoft كطريقة لإنشاء مساعدين صوتيين مخصصين، ودبلجة المحتوى إلى لغات مختلفة وإنشاء روايات مخصصة للقصص والكتب الصوتية والبودكاست.

ولدرء المشاكل القانونية المحتملة، تطلب مايكروسوفت من المستخدمين تقديم “موافقة صريحة” في هيئة بيان مسجل قبل أن يتمكن العميل من استخدام صوته الشخصي لتركيب أصواته. يتم الوصول إلى الميزة خلف نموذج التسجيل في الوقت الحالي، ويجب أن يوافق العملاء على استخدام الصوت الشخصي فقط في التطبيقات “حيث لا يقرأ الصوت المحتوى الذي أنشأه المستخدم أو المحتوى المفتوح”.

كتبت Microsoft في منشور بالمدونة: “يجب أن يظل استخدام النموذج الصوتي داخل التطبيق ويجب ألا يكون الإخراج قابلاً للنشر أو المشاركة من التطبيق”. “[C]يحتفظ العملاء الذين يستوفون معايير أهلية الوصول المحدود بالتحكم الوحيد في إنشاء النماذج الصوتية ومخرجاتها والوصول إليها واستخدامها [where it concerns] دبلجة الأفلام والتلفزيون والفيديو والصوت للسيناريوهات الترفيهية فقط.

لم تجب Microsoft على أسئلة TechCrunch حول كيفية تعويض الممثلين مقابل مساهماتهم الصوتية الشخصية – أو ما إذا كانت تخطط لتنفيذ أي نوع من تقنية العلامات المائية حتى يمكن التعرف على الأصوات التي يولدها الذكاء الاصطناعي بسهولة أكبر.

لمزيد من تغطية Microsoft Ignite 2023:

تم نشر هذه القصة في الأصل الساعة 8 صباحًا بتوقيت المحيط الهادئ يوم 15 نوفمبر وتم تحديثها الساعة 3:30 مساءً بتوقيت المحيط الهادئ.



Source link

Back To Top