هناك قول قديم في أعمال الصحافة: إذا أخبركت والدتك أنها تحبك ، تحقق من ذلك. النقطة المهمة هي أنك تحتاج أيضًا إلى أن تكون متشككًا في مصادرك الأكثر موثوقية. ولكن ماذا لو ، بدلاً من والدتك ، هذا نموذج AI التوليدي مثل انفتاح الانفتاح هو إخبارك بشيء؟ هل يجب أن تثق في الكمبيوتر؟

الطريق إلى زوج من علماء الكمبيوتر في جامعة كارنيجي ميلمان في جنوب غرب جنوب غرب هذا الأسبوع؟ لا. تحقق من ذلك.

هذا الأسبوع ، أوستن ، تكساس ، أبرز المؤتمر الذكاء الاصطناعي. ناقش الخبراء الثقة ، وتغيير مكان العمل ، وأكثر من ذلك مع المستقبل والصور الأكبر. ركز أساتذة مساعد CMU شيري وو ومارتن ساب أكثر هنا والآن ، مع بعض النقاط لاستخدام الأفضل للاستخدام ، وليس سوء الاستخدام ، مثل قوارب دردشة الذكاء الاصطناعى المدربين على نماذج اللغة الكبيرة.

قال SAP ، “إنهم في الواقع بعيدًا عن الكمال وليسوا مناسبة لجميع مشكلات الاستخدام التي يريد الناس استخدامها”.

هناك خمس نصائح حول كونها أكثر ذكاءً من الذكاء الاصطناعي.

كن واضحا بشأن ما تريد

مهما كانت النكات على موقع التواصل الاجتماعي مثل Twitter أو Bluesky ستخبرك بمدى صعوبة التعبير عن السخرية في النص. والملصقات (على الأقل البشر) في هذه المواقع تعرف المؤشرات الاجتماعية التي تشير إلى أنه عندما لا تكون حرفيًا. LLM لا.

قال SAP أن LLMs اليوم قد اتخذت حرفيا كلمات أكثر من الكلمات لأكثر من نصف الوقت ، وهم يكافحون مع التفكير الاجتماعي.

وقال إن الحل هو إنشاء المزيد والمزيد من المؤشرات الخاصة بك. تأكد من أن النموذج يعرف ما تقوله لإعداده. انتبه إلى ما تريد ، ولا تعتقد أن LLM ستقوم بإزالة سؤالك الأصلي.

الروبوتات واثقة ولكنها غير صحيحة

ربما تكون أكبر مشكلة في أدوات ANMINATO AI هي أنها تخدع ، أي أنها تعد الأشياء. قال SAP إنه في مجالات خاصة مثل القانون والطب ، بمعدلات عالية ، يمكن خداع ربع.

المشكلة تتجاوز مجرد خطأ. قال SAP أن قوارب الدردشة يمكن أن تكون واثقة رداً على ذلك عندما تكون مخطئة تمامًا.

وقال “عندما يكون النموذج خطأ ، فإنه يهدد البشر بالاعتماد على آثار الإيمان هذه”.

الحل سهل: تحقق من ردود LLM. طلب إجراء اختلافات عدة مرات أو على نفس السؤال حول نفس السؤال ، وقال: “يمكنك التحقق من اتساقها”. قد ترى نتائج مختلفة. وقال “في بعض الأحيان سترى أن النموذج لا يعرف حقًا ما يقوله”.

أهم شيء هو التأكيد من المصادر الخارجية. هذا يعني أيضًا أنه يجب عليك توخي الحذر من طرح الأسئلة التي لا تعرفها الإجابة. قال وو إن استجابات Jinger AI هي الأكثر فائدة عندما تكون في موضوع تدركه ، حتى تتمكن من معرفة ما هو صحيح وما هو غير ذلك.

وقال “اتخذ قرارات واعية حول الاعتماد على نموذج وعندما لا”. “لا تثق في نموذج عندما يخبرك أنه واثق للغاية.”

لا يمكن أن تحافظ منظمة العفو الدولية على سرية

المخاوف المتعلقة بالخصوصية مع LLM مرتفعة. هذا يتجاوز إعطاء المعلومات التي لا ترغب في رؤية آلة على الإنترنت يمكنها إعادة تنظيمها لأي شخص يسألها جيدًا. وقال النسغ إن مظاهرة مع انفتاح المفتوحة أظهرت أنه عندما طُلب منه تنظيم الحزب المذهل ، أخبر الرجل الذي فوجئ بالحزب.

قال: “LLMS ليست جيدة في تقديم حجة حول من يعرف ماذا ومتى ومتى يجب أن تكون المعلومات الخاصة.”

قال وو لا تشارك البيانات الحساسة أو الشخصية مع LLM.

وقال “كلما قمت بمشاركة أي شيء قمت بإنشائه إلى النموذج ، تحقق دائمًا من ما إذا كان هناك شيء لا ترغب في إصدار LLM”.

تذكر أنك تتحدث إلى آلة

تم القبض على قوارب الدردشة جزئيًا بسبب مدى نسخ خطاب الإنسان. لكن هذا كله تقليد. قال النسغ إنه ليس إنسانًا حقًا. يقول النموذج أشياء مثل “أتساءل” و “أتصور” لأنها تدرب على اللغة التي تتضمن الكلمات ، ليس لأن لديهم خيال. قال SAP ، “الطريقة التي نستخدم بها اللغة ، كل هذه الكلمات تعني”. “هذا يدل على أن نموذج اللغة يتخيل الأشياء ، وأنه يحتوي على عالم داخلي.”

قد يكون من الخطر التفكير في نماذج الذكاء الاصطناعي كإنسان. قال SAP أن LLMs لا تعمل مثل البشر ، وأن تعاملهم لأنهم بشر يمكنهم تعزيز الصور النمطية الاجتماعية.

قال: “من المرجح أن يكون البشر مثل البشر أو الوعي في أنظمة الذكاء الاصطناعي”.

قد لا يتم فهم استخدام LLM

قال SAP إنه على الرغم من الادعاءات المتعلقة بـ LLMS ، إلا أنها قادرة على البحث والتفكير المتقدمين ، إلا أنها لا تعمل بشكل جيد بعد. المعايير التي تشير إلى أن النموذج يمكن أن يؤدي على مستوى الدكتوراه. لا يوجد سوى معايير ، ولا تعني الاختبارات وراء هذه المراجعات أن النموذج يمكن أن يعمل على المستوى الذي تريد استخدامه له.

وقال “هذا هو وهم تعزيز قدرات الذكاء الاصطناعي ، مما يجعل الناس يتخذون قرارات في أعمالهم بسرعة”.

قال وو إنه عندما تقرر ما إذا كان يجب عليك استخدام نموذج AI التوليدي لمهمة ما ، فكر في الفوائد والعيوب المحتملة لاستخدامها ، وما هي الفوائد والعيوب المحتملة لعدم استخدامه.



رابط المصدر