أداة GPT-3: عندما يغير الذكاء الاصطناعي قواعد اللعب في توليد الجمل النصية أو الاكواد البرمجية

مصدر الصورة: axios.com

للفضول البشري تجاه الآلات والذكاء الاصطناعي حدود متفاوتة، كثيراً ما يتم كسرها عند التوصل إلى تقنيات جديدة تحاكي أي تصرفات أو إنتاج تفاعلي مرتبط أو مشابه للبشر. الكتابة اليوم بوصفها وسيلة للتواصل البشري بتمثيلها للغة معينة تم التعدي عليها من قبل خوارزميات الذكاء تلك بل و وصل الأمر أيضاً للغات البرمجية التي يمكن عن طريقها بناء برامج أو أدوات أو أنظمة معقدة للغاية.

ذلك كان الملخص العام لحملة الضجيج الاجتماعية التي تم إثارتها على مواقع التواصل الاجتماعي بعد الكشف عن الإصدار الجديد من أداة GPT-3، تم إرفاق حملة الضجيج السابق ذكرها بمجموعة من التجارب والإخراجات الأدبية أو العشوائية التي توصلت إليها الأداة مع تضمين تخوف مبطن تجاه توصل الذكاء الاصطناعي إلى مراحل أكثر تقدماً مرتبطة بالوعي أو الإدراك العام “التخيلي” حتى للحظة.

اعتماد أداة GPT-3 على قاعدة بيانات ضخمة إضافة إلى “تلقين” مستمر من قبل مستخدمها والقدرة على تعلّم مصطلحات وكلمات وربطها بمعاني جديدة أمر يبعث على الفضول بالفعل، إلا أن التهويل المرتبط بها ما زال مبالغاً به إلى حد كبير. ضمن المقال سنطرح المراحل التطورية التي مرت بها الأداة إضافة لاستعراض جزء من الأمثلة والرأي العام الذي تشكل حولها من قبل بعض المهتمين بالذكاء الاصطناعي والتقنيات المرتبطة به.

 

مشروع GPT-3: مسيرة التطور المتسارع للنماذج اللغوية في الذكاء الاصطناعي

مشروع GPT تم بناؤه بالاعتماد على عدة نماذج لغوية سابقة تم تصميمها من قبل الخبراء في جوجل ومايكروسوفت، لكن من المهم حقاً هو معرفة أن نماذج اللغة تعتمد بشكل جذري على ما يعرف بنماذج أو آليات الانتباه (Attention models) وهي عبارة عن تقنية تسمح بتصنيف المدخلات المعقدة إلى الشبكات العصبية (في التعلم العميق) عبر مجموعة من البيانات، والهدف من ذلك تقسيم المهام المعقدة إلى مهام أصغر لحلها فيما بعد بشكل مشابه للآلية التي يعمل بها العقل البشري.

رسم توضيحي يوضح الفرق بين النماذج اللغوية الأولية

الخبراء في جوجل استخدموا النماذج تلك لإنشاء برنامج لغوي يسمى Transformer وحقق نتائج جيدة للغاية كما تم استخدامه تدريجياً في الترجمة الدقيقة بدلاً من الاعتماد على الترجمة الحرفية. ومن هنا كانت انطلاقة الجيل الأول من مشروع GPT اعتماداً على نفس الأساسيات والنماذج المستخدمة في Transformer.

تم التوصل حينها من قبل مركز الأبحاث OpenAI (المطورين لمشروع GPT) إلى نهج جديد أطلق عليه بالتعلم الغير خاضع للإشراف والذي يهدف اختصاراً إلى التوصل إلى استنتاجات بعد تحليل بيانات ضخمة غير مصنفة، في عام 2018 كانت ولادة GPT-1 تم دمج هذه الآلية مع آليات الانتباه السابق ذكرها إضافة لبيانات يقدر حجمها ب5 جيجابايت من النصوص والكتب في ذلك الوقت.

إعلان

التعلم غير الخاضع للإشراف (unsupervised learning): هو نوع من التعلم الآلي الذي يبحث عن أنماط لم يتم اكتشافها سابقًا في مجموعة بيانات بدون تسميات موجودة مسبقًا وبحد أدنى من الإشراف البشري

افترض الخبراء والباحثون في المشروع أنه كلما زاد حجم البيانات المدخلة تجعل النماذج اللغوية أكثر دقة، في الجيل الثاني GPT-2 وصل حجم البيانات إلى 40 جيجابايت، أما في النسخة التجريبية الأخيرة من GPT-3 التي أعلن عن انطلاقتها في ربيع العام الحالي فقد وصل حجم البيانات ضمنها إلى 570 جيجابايت بعد تنقيحها وإضافة مختلف المصادر و الكتب والصفحات عبر الإنترنت.

 

الأنماط المختلفة لأداة GPT-3، لا يوجد حدود للإبداع!

دائما ما كان لتواصل البشر مع الآلة موضوع مثير للجدل، سواء من ناحية القدرة على توقع الإجابات الناتجة عنها أو التعمق أكثر في مواضيع وجودية أو فلسفية بحتة بدافع الفضول لا أكثر. قدرات الذكاء الاصطناعي اليوم تعدت “بوتات” المحادثة البسيطة والتي بدأت قديماً وأخذت ما يكفي نصيبها في ستينيات القرن الماضي عبر برنامج ELIZA الشهير.

إعلان

بوت ELIZA
صورة للواجهة النصية في بوت ELIZA

اليوم، أصبح بالإمكان التواصل بشكل أكثر سهولة وبساطة مع الآلة باستخدام اللغة الانكليزية فقط، والمخرجات ستكون مبهرة أكثر مما قد يتصوره العقل، بدءاً من الإكمال التلقائي للجمل وانتهاءاً بمهام برمجية معقدة يمكن عن طريقها توليد الأكواد البرمجية بسرعة فائقة. وفيما يلي نستعرض نماذج تم بناؤها بالاعتماد على GPT-3.

 

المحادثات (Conversations)

من أكثر النماذج استخداماً نظراً لأن نماذج المحادثة تعتبر مشوقة للغاية (لنفس الأسباب المذكورة سابقاً) كما أنه من السهل استخدامها من قبل شريحة أوسع من المستخدمين، نماذج المحادثة تتخذ نمطاً متشابهاً في أغلب الأحيان من ناحية معطيات الادخال والاخراج، حيث تكون عبارة عن سؤال من المستخدم وإجابة من الأداة.

الامثلة التي تم استعراضها عبر الإنترنت مثيرة للجدل حقاً من ناحية قدرة الأداة على التكيف مع مختلف أنواع الأسئلة، بل وتعلم مفردات جديدة وربطها بإجابات أكثر دقة. تم استخدام النموذج السابق في خدمات دعم الزبائن المباشرة التي يتم تضمينها ضمن مواقع الويب، وبالفعل فإن للسيناريو الحواري المفترض بين الزبون والاداة كان يعمل بشكل جيد و”بشري” للغاية.

 

البرمجة (programming)

بعيداً عن الإجابة عن الأسئلة والكتابة الأدبية، ماذا لو امتلكت الآلة القدرة على إنشاء البرامج وتدريبها ذاتياً؟ حسناً أصبح الأمر كذلك بالفعل لكن ليس بنفس درجة المبالغة التي يتم استخدامها ضمن التغريدات والمنتديات الخاصة بالمبرمجين. باستخدام GPT-3 يمكن القيام بمختلف المهارات البرمجية وكتابة الأكواد واختبارها أيضاً، ومن بين النتائج التي يمكن الحصول عليها بعد تضمين الاداة مع مشاريع برمجية أو أدوات أخرى:

  1. بناء التطبيقات وتصميم الواجهات الخاصة بها
  2. بناء مواقع الويب
  3. كتابة استعلامات SQL لاستخدامها في قواعد البيانات

إضافة إلى العديد من المشاريع والأمثلة الأخرى التي تم بناؤها وتجربتها واستعراضها، لكن يجب التمهل هنا قليلاً ووضع الأمور في نطاقها الصحيح. المبالغة والضجيج والتهويل من قدرات الأداة البرمجية أمر مثير للشفقة فعلاً، لا يمكن إنكار دور أداة GPT-3 في تحويل اللغة الانجليزية المبسطة إلى تعليمات برمجية في غضون ثوان معدودة، إلا أن الخرج الناتج عنها ليس إلا إكمال تلقائي مع كثير من العيوب الضمنية، حيث أن الأداة لن تكترث باختبارات الأداء المطبقة على أي كود أو تعليمة برمجية يتم التوصل إليها وإكمالها عن طريقها (حتى الآن).

 

توليد الجمل (Generate sentences)

يتم توليد الجمل عادة عبر استخدام كلمة واحدة فقط، والبحث في البيانات المدخلة للأداة لتشكيل جمل كاملة تشبه التغريدات القصيرة على تويتر أو بشكل موسع أكثر كشرح لتقنية أو موضوع ما في فقرة مكونة من عدة جمل، بشكل عام وبالنظر للأمثلة التي تم استعراضها فإن الجمل العشوائية التي تم توليدها تحمل طابع العبثية في كثير من الأحيان، وبعيدة عن المنطق في أحيان أخرى.

فيما يلي أمثلة من تلك الجمل، تم اقتباسها كما وردت في المصادر بشكل كامل دون أي تعديل:

  • Technology optimizes systems. People optimize culture.
  • All cryptocurrency is fraud. It is backed by nothing real and it is made out of thin air (except the electricity used).
  • User experience is first and foremost for the users’ experience.

قدرات الاداة ليست محصورة فقط بالأنماط التي تم ذكرها سابقاً، حيث تم استخدامها في مجال التصميم وتلخيص الفقرات وإعادة صياغتها إضافة إلى توليد عدد غير محدود من الجمل والأفكار. القدرات والكفاءة المرتبطة بأداة GPT-3 مرتبطة بشكل جذري بحجم البيانات الضخم المدخل عن طريقها مقارنة مع الأجيال السابقة من الأداة.

 

هل يمكن لأداة GPT-3 اجتياز اختبار تورينغ؟

في تجربة مثيرة قام بها Kevin Lacker (مهندس مبرمج يعمل في عدة شركات كبرى) حول إمكانية الأداة تجاوز اختبار تورينغ تم نشر نتائجها بالكامل في مدونته، النتائج كانت متباينة بين مختلف المجالات التي تم التطرق إليها في الاختبار، الخلاصة التي تم التوصل إليها هو اتباع الأداة لنمط معين في الإجابة قد يخلق بعض الإجابات الطريفة بالفعل (الصورة أدناه) والتي هي بلا شك إجابات بعيدة كل البعد عن “الإنسانية” التي يدور حولها اختبار تورينغ.

مثال (1): أسئلة غير منطقية تم طرحها على الأداة

بينما كان من الملاحظ دقة الأجوبة التي أظهرتها أداة GPT-3 في الأسئلة البسيطة التي تعتمد على أجوبة موجودة ومعدة مسبقاً أو تم تضمينها في الأداة، كأن يتطرق السؤال إلى معلومات عامة يمكن للجميع الوصول لها أو معرفتها.

مثال (2): ضعف في اجراء العمليات الحسابية المتعلقة بالأداة

تطور متسارع للذكاء الاصطناعي، حماس كبير ومُعضلات فلسفية وأخلاقية تلوح في الأفق

البشر دائماً ما كانوا مفتونين بالآلات أو الخوارزميات التي لديها القدرة على الاستجابة بذكاء، و المسار التطوري الخاص بالخوارزميات تلك قد يمهد الطريق لمرحلة جديدة متعلقة بكيفية التفاعل بين الآلة والبشر، لكن القدرة على خلق الجمل والكلمات ليس طريقة مُثلى للتواصل مثلما يتحدث عنه الكثير من الأشخاص لإثارة الحماس تارة ومخاوف مبطنة تارة أخرى.

التخوف الحقيقي يكمن في عدم فهم نقاط وضعف التقنيات التي يتم التوصل إليها وتجاهلها مع الزمن، من بين المخاوف المرتبطة بالنماذج اللغوية مثل GPT-3 التحيز الضمني (Implicit bias) نتيجة افتقار النماذج تلك للوعي اللازم، بينما للتعدي على الوظائف البشرية في مختلف المجالات نصيب أيضاً من المخاوف نفسها تجاه هذا النوع من التقنيات، الأمر الذي سيشكل مع الزمن أزمات أخلاقية تواجه المطورين المسؤولين عنها والتي استدعت البدء بها فعلاً للتوصل إلى مبادئ أخلاقية يتم تحديدها لخوارزميات الذكاء الاصطناعي.