لماذا يعتبر ChatGPT سيئًا جدًا في الرياضيات؟ | تكنولوجيا
إذا سبق لك أن حاولت استخدام Chat GPT كآلة حاسبة، فمن المؤكد أنك لاحظت أنها غير قادرة على إجراء العمليات الحسابية. إن Chatbots سيئة في الرياضيات، وهذه ليست سمة فريدة بين أدوات الذكاء الاصطناعي.
من ناحية أخرى، لا يستطيع كلود من الأنثروبي حل المسائل اللفظية البسيطة، ولا يستطيع الجوزاء فهم المعادلات التربيعية ويواجه اللاما من ميتا. كيف تواجه هذه الروبوتات الذكية الحسابات الرياضية في المستوى الابتدائي؟
الإجابة هي “عملية تشفير”، حيث يساعد الذكاء الاصطناعي في تشفير المعلومات بطريقة كثيفة من خلال عملية تجزئة البيانات إلى أجزاء (على سبيل المثال، عن طريق تقسيم كلمة “جميل” إلى مقاطع من ‘c’ ‘m’ ‘j’ ‘ ل’). ولأن أدوات التجزئة في النماذج الذكية لا تعرف ما هي الأرقام، فإنها غالبًا ما تقطع العلاقات بينها.
على سبيل المثال، قد تتعامل أداة التجزئة مع “380” ككائن واحد، ولكنها تفهم “381” كزوج من الأرقام (“38″ و”1”)، وسيحدث الخطأ.
لكن عملية البرمجة ليست السبب الوحيد لضعف الذكاء الاصطناعي في الرياضيات. أنظمة الذكاء الاصطناعي هي آلات إحصائية، وبعد تدريبها على العديد من الأمثلة، تتعلم أنماط تلك الأمثلة لإجراء التنبؤات.
في أحد الأمثلة، عندما سئل GPT Chat عن مشكلة ضرب مثل 5.7897 × 1.2832، من المحتمل أن يستنتج النموذج أن حاصل ضرب رقم ينتهي بـ “7” ورقم ينتهي بـ “2” سينتهي بـ “4”. ويتم ذلك من خلال الاعتماد على الأخطاء في عمليات الضرب التي تمت مواجهتها سابقًا والتعلم منها.
لكنه سيواجه صعوبة في الجزء الأوسط وسيعطي الإجابة 742,021,104، بينما الإجابة الصحيحة هي 742,934,304.
قام يونتيان دينغ، الأستاذ المساعد في جامعة واترلو والمتخصص في الذكاء الاصطناعي، بتقييم قدرات الضرب لـ GPT على نطاق واسع في دراسة أجراها هذا العام.
وقد وجد هو وزملاؤه أن النموذج القياسي، GPT-4o، واجه صعوبة في ضرب الأعداد التي تحتوي على أكثر من أربعة أرقام، مثل 3,459 × 5,284.
قال دينغ إن GPT-4O يواجه صعوبة في ضرب أرقام متعددة لأنه يحقق دقة أقل من 30% عند ضرب أرقام مكونة من 4 أرقام. وأضاف أن هذه الأنواع من الحسابات “تمثل تحديا لنماذج اللغة، لأن أي خطأ في خطوة لاحقة يمكن أن يتراكم ومن ثم يؤدي إلى نتيجة نهائية غير صحيحة”.
ومن ناحية أخرى، أعرب دنغ عن تفاؤله. وفي الدراسة التي أجراها هو وزملاؤه على نموذج “O1″، وهو نموذج “الاستدلال” الخاص بشركة OpenAI، حقق النموذج نتائج أفضل بكثير من “GPT-4” لأنه يمكنه حل عمليات الضرب لأعداد المكونات. من 9 أرقام بشكل صحيح في حوالي نصف الوقت.
وأضاف: “يمكن للنموذج أن يحل عملية الضرب بطرق تختلف عن الطرق التي نحلها بها يدويًا، وهذا يثير فضولنا حول منهج النموذج في حل المشكلات وكيف يختلف عن المنطق البشري”.