استنسخ عالم بيانات الدردشة الجماعية لأصدقائه باستخدام الذكاء الاصطناعي
[ad_1]
كما يقول عالم البيانات إيزي ميلر ، فإن الدردشة الجماعية “مقدسة” في مجتمع اليوم. سواء كنت تستخدم iMessage أو WhatsApp أو Discord ، فهو المكان الذي تقضي فيه أنت وأصدقاؤك المقربون لقضاء وقت ممتع ، والتقاط الصور ومشاركة التحديثات حول الحياة – سواء كانت تافهة أو مهمة. في عالم نلعب فيه بمفردنا بشكل متزايد ، يمكننا على الأقل أن نشكو في الدردشة الجماعية حول مقدار مص البولينج هذه الأيام.
يقول ميلر: “محادثتي الجماعية هي شريان حياة وراحة ونقطة اتصال”. الحافة. “واعتقدت أنه سيكون من الممتع ونوع من الشرير استبدالها.”
باستخدام نفس التكنولوجيا التي تشغل برامج الدردشة مثل Microsoft Bing و ChatGPT من OpenAI ، أنشأ ميلر نسخة من الدردشة الجماعية لأصدقائه المقربين ، وهي محادثة استمرت كل يوم على مدار السنوات السبع الماضية ، منذ أن التقى هو وخمسة من أصدقائه في أول مرة في الكلية. . يقول إنه كان من السهل جدًا القيام به: مشروع استغرق بضع عطلات نهاية الأسبوع من العمل ومائة دولار لتجميعه. لكن النتائج النهائية مذهلة.
يقول ميللر: “لقد فوجئت حقًا بالدرجة التي تعلم بها النموذج بطبيعته أشياءً عن هويتنا ، وليس فقط الطريقة التي تحدثنا بها”. “إنه يعرف أشياء عن من نتواعد ، وأين ذهبنا إلى المدرسة ، واسم منزلنا الذي عشنا فيه ، وما إلى ذلك.”
وفي عالم أصبحت فيه روبوتات الدردشة أكثر انتشارًا وجاذبية بشكل متزايد ، قد تكون تجربة الدردشة الجماعية لمنظمة العفو الدولية شيئًا سنشاركه جميعًا قريبًا.
أصبح المشروع ممكنًا بفضل التطورات الحديثة في الذكاء الاصطناعي ، لكنه لا يزال شيئًا لا يمكن لأي شخص تنفيذه. ميلر هو عالم بيانات يلعب مع هذا النوع من التكنولوجيا منذ فترة – “لدي القليل من العقل على كتفي” ، كما يقول – وهو يعمل الآن في شركة ناشئة تدعى Hex توفر الأدوات التي يساعد بالضبط هذا نوع المشروع. حدد ميلر جميع الخطوات التقنية المطلوبة لتكرار العمل في منشور مدونة ، حيث قدم دردشة جماعية لمنظمة العفو الدولية وأطلق عليها اسم “robo boys”.
ومع ذلك ، فإن إنشاء الأولاد الروبوتات يتبع مسارًا مألوفًا. يبدأ بنموذج لغة كبير ، أو LLM ، وهو نظام تم تدريبه على كميات كبيرة من النصوص المأخوذة من الويب والمصادر الأخرى التي تتمتع بقدرات لغوية واسعة ولكنها خام. ثم تم “ضبط” النموذج ، مما يعني تزويده بمجموعة بيانات أكثر تركيزًا لتكرار مهمة معينة ، مثل الإجابة على الأسئلة الطبية أو كتابة قصص قصيرة بصوت مؤلف معين.
استخدم ميلر 500000 رسالة تم سحبها من محادثته الجماعية لتدريب نموذج ذكاء اصطناعي تمت تصفيته.
في هذه الحالة ، قام ميلر بضبط نظام الذكاء الاصطناعي على 500000 رسالة تم تنزيلها من مجموعة iMessage الخاصة به. قام بفرز المنشورات حسب المؤلف وحث النموذج على تكرار شخصية كل عضو: Harvey و Henry و Wyatt و Kiebs و Luke و Miller نفسه.
ومن المثير للاهتمام أن نموذج اللغة الذي استخدمه ميلر لإنشاء محادثة وهمية تم إنشاؤه بواسطة مالك فيسبوك ميتا. هذا النظام ، LLaMA ، يكاد يكون بنفس قوة طراز OpenAI’s GPT-3 وكان موضع جدل هذا العام عندما تسرب عبر الإنترنت بعد أسبوع من الإعلان عنه. حذر بعض الخبراء من أن التسرب سيسمح للجهات الخبيثة بإساءة استخدام البرنامج لأغراض البريد العشوائي وأغراض أخرى ، لكن لم يفترض أي منهم أنه سيتم استخدامه لهذا الغرض.
كما يقول ميلر ، فهو متأكد من أن Meta كانت ستتيح له الوصول إلى LLaMA إذا طلب ذلك من خلال القنوات الرسمية ، لكن استخدام التسريب كان أسهل. قال: “رأيت (نصًا لتنزيل LLaMA) وفكرت ،” كما تعلم ، أعتقد أنه سيتم إزالته من GitHub ، لذلك قمت بنسخه ولصقه في ملف نصي على سطح المكتب ” . يقول. “وبعد ذلك ، بعد خمسة أيام ، عندما فكرت ،” واو ، لقد حصلت على هذه الفكرة الرائعة “، كان النموذج قد طلب من GitHub وفقًا لقانون الألفية الجديدة لحقوق طبع ونشر المواد الرقمية: لكن ما زلت احتفظت به “.
يوضح المشروع مدى سهولة بناء هذا النوع من أنظمة الذكاء الاصطناعي ، كما يقول. “الأدوات اللازمة للقيام بهذه الأشياء موجودة في مكان مختلف عما كانت عليه قبل عامين أو ثلاثة أعوام.”
في الماضي ، قد يكون إنشاء نسخة مقنعة من محادثة جماعية مع ست شخصيات مختلفة هو الشيء الذي يستغرق إنجازه فريقًا في الجامعة شهورًا. الآن ، مع قليل من الخبرة وميزانية صغيرة ، يمكن لأي شخص بناء واحدة من أجل المتعة.
بمجرد تدريب النموذج على رسائل الدردشة الجماعية ، قام Miller بتوصيله بنسخة من واجهة مستخدم iMessage من Apple ومنحه حق الوصول إلى أصدقائه. تمكن الرجال الستة ونسخهم من الذكاء الاصطناعي من التحدث معًا ، حيث تم تحديد الذكاء الاصطناعي من خلال عدم وجود اسم العائلة.
أعجب ميللر بقدرة النظام على نسخ إيماءاته وإيماءات أصدقائه. يقول إن بعض المحادثات بدت حقيقية للغاية ، مثل الجدل حول من يشرب بيرة هنري ، وأنه كان عليه أن ينظر في سجل الدردشة الجماعية للتحقق من أن النموذج لم يكن يقوم فقط بتشغيل نص بيانات التدريب الخاصة به. (يُعرف هذا في عالم الذكاء الاصطناعي باسم “overfitting” وهو الآلية التي يمكن أن تجعل روبوتات المحادثة تسرق خلاصاتها.)
كتب ميلر في مدونته: “هناك شيء رائع في التقاط أصوات أصدقائك بشكل مثالي”. “ليس حنينًا تمامًا لأن المحادثات لم تحدث أبدًا ، ولكن إحساسًا مشابهًا بالبهجة … لقد وفر هذا حقًا ساعات من المتعة العميقة لي ولأصدقائي أكثر مما كنت أتخيله.”
“إنه ليس حنينًا كليًا لأن المحادثات لم تحدث أبدًا ، لكنه شعور مماثل بالغبطة.”
ومع ذلك ، لا يزال النظام يعاني من مشاكل. يلاحظ ميلر أن التمييز بين الشخصيات الست المختلفة في الدردشة الجماعية يمكن أن يكون غير واضح ، وأن أحد القيود الرئيسية هو أن نموذج الذكاء الاصطناعي ليس له أي إحساس بالتسلسل الزمني: فهو لا يستطيع التمييز بشكل موثوق بين الأحداث الماضية والحالية (مشكلة الذي يؤثر على جميع روبوتات المحادثة إلى حد ما). يمكن الإشارة إلى الصديقات السابقات كما لو كن شركاء حاليين ، على سبيل المثال ؛ كما سبق للوظائف القديمة والمنازل.
يقول ميلر إن إدراك النظام لما هو واقعي لا يعتمد على فهم شامل للدردشة ، على تحليل الأخبار والتحديثات ، ولكن على مقدار بمعنى آخر ، كلما تم الحديث عن شيء ما ، زاد احتمال أن تشير إليه الروبوتات. والنتيجة غير المتوقعة لذلك هي أن مستنسخات الذكاء الاصطناعي تميل إلى التصرف كما لو كانت لا تزال في الكلية ، لأن هذا هو الوقت الذي كانت فيه الدردشة الجماعية أكثر نشاطًا.
تقول ميلر: “يعتقد النموذج أنه عام 2017 ، وإذا سألتها عن عمرنا ، فهي تقول إننا 21 و 22 عامًا”. “ينطلق في الظل ويقول ،” أين أنت؟ “،” أوه ، أنا في الكافيتريا ، تعال. ” هذا لا يعني أنه لا يعرف من أواعد حاليًا أو أين أعيش ، ولكن إذا تركناه وشأنه ، فإنه يعتقد أننا في سن الجامعة “. يتوقف للحظة ويضحك: “وهذا يضيف حقًا إلى الفكاهة في كل ذلك. إنها نافذة على الماضي “.
يوضح المشروع القوة المتزايدة لروبوتات الدردشة الذكية ، ولا سيما قدرتها على تكرار إيماءات ومعرفة أفراد معينين.