قدمت Microsoft للتو الصهارة ، نموذج ذكاء اصطناعي جديد تم تصميم الروبوت للمساعدة بذكاء وفهم والعمل. على عكس نماذج الذكاء الاصطناعى التقليدية ، تقوم Magma بمعالجة مجموعة متنوعة من البيانات في نفس الوقت – وهي محاولة تقفز نحو Microsoft “Agent AI”. أو النظام الذي يمكنه تخطيط وتنفيذ المهام نيابة عن المستخدم.
يتم تدريب هذا النموذج ، الذي يستخدم مجموعات معالجة الرؤية واللغة ، على مقاطع الفيديو والصور وبيانات الروبوتات ومحادثات الواجهة لجعلها أكثر تنوعًا من النماذج السابقة.
على صفحة HUB GUT ، قال فريق Microsoft Research كيف يمكن لـ Magma أن تعمل ، مثل كيفية إضافة الروبوت والتنقل في واجهة المستخدم مثل النقر على الأزرار.
لتطوير هذه التكنولوجيا ، ساهمت الشركة مع باحثين في جامعة ماريلاند وجامعة ويسكونسن الطب وجامعة واشنطن.
برز الإطلاق كسباق لعمالقة التكنولوجيا لإعداد وكلاء الذكاء الاصطناعى الذين يمكنهم تلقائيًا جوانب الحياة اليومية. تقوم Google بدفع نماذج اللغة المستندة إلى الروبوتات ، في حين تم تصميم أداة Open AI Operator للتعامل مع مهام العالم مثل إنشاء تحفظات وطلب البقالة وملء النموذج من خلال الكتابة والنقر والتمرير في متصفح خاص.
أخبر باحث Microsoft المركزي للمشروع جيانفي يانغ CNET أن مستقبل الذكاء الاصطناعى هو أكثر بكثير من إنتاج نموذج الأساس متعدد الوسائط لأحذية الدردشة.
وقال: “نعتقد أن الخطوة المهمة التالية للمنظمة العفوبية تعتمد على النمو العوامل التي يمكنها التسوية والتفاعل مع البيئة الرقمية والمادية دون انقطاع”.
وقال إن أهمية الصهارة في القدرة على القضاء على فجوة عملاء الذكاء الاصطناعى متعدد الوسائط ، حيث إن نماذج الذكاء الاصطناعى التقليدية تؤدي أداءً جيدًا في الذكاء اللفظي ولكنها غالبًا ما تكافح مع التخطيط والعمل الحقيقي.
وأوضح أن “الروبوتات تعتمد غالبًا على تدريب معين على بيانات محددة من المجال المحددة ، مما يؤدي إلى محدودية قدرتها على التعامل مع المهام السهلة اليومية ، والسماح بتطبيع مهام وبيئات جديدة.” “يغير Magma ذكائها الفموي والمحلي بشكل كبير ، والذي يسمح للروبوتات بأداء أفعالها في الجزء العلوي من البيئة ، إما الرقمية أو المادية ، والعملية ، خاصة وفعالية.”
وفي الوقت نفسه ، قال كريج لو كلير ، المحلل الرئيسي في فورستار ومؤلف عمل عشوائي من الأتمتة – إن الأخبار مرتبطة بتنبؤ شركة أبحاث السوق بأن 25 ٪ من مشاريع الروبوتات 2025 ستجمع الأتمتة الأكاديمية والفيزيائية. ومع ذلك ، فإن النقاش يجري ما إذا كانت هذه الإعلانات وغيرها تشير إلى نقطة تحول حقيقية أو أكثر إدخالات لغة كبيرة.
وقال لي كلير: “لقد قدمت Microsoft إمكانات مطور مهمة ، ولكن الآن يجب أن تقودها تفاعلات الروبوت البشرية الإنتاجية والآمنة”.