مع جوعهم للبيانات ، تضع شركات الذكاء الاصطناعى ويكيبيديا

الشركات التي تطور الذكاء الاصطناعي تعرض ويكيبيديا للخطر. مؤسسة ويكيميديا ، الشركة الأم للأنسجة الشهيرة على الإنترنت في مدونة نُشرت يوم الثلاثاء.
تنبع المشكلة من شعبية Wikipedia السريعة الممتدة والموقع الشقيق ويكيميديا المشاع ، حيث يمكن العثور على الصورة والصوت والفيديو. ولكن ليس في المقام الأول أن يزور بشكل واضح مواقع ويكيميديا منذ العام الماضي ، وبالتالي تهدف بشكل كبير من البنية التحتية. هم روبوتات.
يتم استخدام برامج الكمبيوتر هذه من قبل مطوري الذكاء الاصطناعى لرعي الإنترنت تلقائيًا وجمع أكبر قدر ممكن من البيانات لتدريب نماذج اللغة الكبيرة التي تسمى (LLMS). تشكل نماذج اللغة هذه أساس أنظمة مثل ChatGPT من Open-AI ، والتي يمكن أن تنتج نصًا استجابةً للأسئلة ، والمزيد من الصور والصوت.
تحتوي المجموعات الضخمة من Wikipedia و Wikimedia Commons التي جمعها المتطوعون على ثروة من المعلومات الموثوقة ويمكن استخدامها مجانًا للجميع. هذا يجعلهم مصدرا جذابا لأنظمةهم لشركات الذكاء الاصطناعى.
ديناميات أخرى
كانت محتويات Wikimedia ، التي تكتب المؤلفين الثلاثة في مدونتهم ، دائمًا جزءًا مهمًا من النتائج التي تم عرضها على الأشخاص في محركات البحث. “لقد دفعوا المستخدمين بدورهم إلى مواقعنا الإلكترونية. ولكن مع صعود الذكاء الاصطناعي (AI) ، تتغير الديناميات.”
تغمر الأنظمة التلقائية لشركات الذكاء الاصطناعى مواقع ويكيميديا ، ولكن في كثير من الأحيان لا تذكر chatbots من أين حصلوا على معلوماتهم-حتى لو فعلوا ذلك ، فإن ويكيميديا تعطي عدد قليل نسبيًا من الزوار. تعد الزيارة الكبيرة التي يمكن للبروتات على المواقع الإلكترونية عبئًا ثقيلًا على البنية التحتية: حركة مرور الروبوتات تأخذ الكثير من “عرض النطاق الترددي” ، بحيث تحدث التأخير للجميع – للمستخدمين البشريين أيضًا.
محتوىنا مجاني ، لكن بنيتنا التحتية ليست كذلك
يقول ويكيميديا: “تم تصميم بنيتنا التحتية لتكون قادرة على امتصاص زيادة مفاجئة في الزوار البشريين في المناسبات الخاصة”. “لكن مقدار حركة المرور التي نتحرك فيها من خلال الروبوتات التي تتخلص من الإنترنت غير مسبوقة وتستلزم مخاطر وتكاليف كبيرة.”
المخاطر لأن فنيي ويكيميديا لديهم أيديهم مليئة بزيارة الروبوتات الكبيرة التي تتناول الجوع للبيانات. ونتيجة لذلك ، فإن الفنيين لديهم وقت أقل لإجراء زيارة بشرية إضافية لمواقع الويب تعمل بسلاسة في حالة حدوث أحداث رئيسية غير متوقعة.
تأتي التكاليف الإضافية من خلال الحاجة إلى استخدام المزيد من الموظفين التقنيين ، علاوة على ذلك ، مما يتيح المزيد من النطاق الترددي. وقال ويكيميديا: “نقر بأن الإنترنت بأكمله يستخدم محتوىنا ، ولكن يجب أن يحدث بطريقة يمكن أن تستمر بالنسبة لنا”. “محتوىنا مجاني ، لكن بنيتنا التحتية ليست كذلك.” يتم تمويل مؤسسة ويكيميديا بالكامل تقريبًا من خلال التبرعات.
خادم قريب
تستخدم Wikimedia مراكز البيانات في جميع أنحاء العالم لتتمكن من خدمة مستخدميها بسرعة. على سبيل المثال ، إذا تم طلب مقالة على ويكيبيديا غالبًا من قبل مستخدم أو مجموعة من المستخدمين ، يتم تخزين المحتوى على خادم قريب من هؤلاء المستخدمين ، بحيث يمكن تسليمه بسرعة. تبقى المقالات المطلوبة على خادم مركزي. إذا تم طلبهم ، فيجب على الطلب أولاً “السفر” على طول الطريق إلى مركز البيانات هذا ، ثم المقالة مرة أخرى إلى المستخدم ، والتي تكلف المزيد من الوقت والمال.
غالبًا ما يطلب المستخدمون البشريون نفس المقالات ، على سبيل المثال لأن الموضوعات موجودة في الأخبار. لكن روبوتات شركات الذكاء الاصطناعى مهتمة بجميع المحتوى ، بما في ذلك الصفحات الأقل شعبية ، والتي غالباً ما يجب أن تقودها إلى الخوادم المركزية ، “ما يجعلها أكثر تكلفة بالنسبة لنا” ، قالت ويكيميديا. على سبيل المثال ، فإن Wikipedia من الذكاء الاصطناعي ، “يكتب كيسي نيوتن ، كاتب عمود التكنولوجيا في رسالته الإخبارية منصة.
اقرأ أيضا
الأساس وراء ويكيبيديا المثالية أخذت مخرج تجاري
تمامًا كما هو الحال بالنسبة لشركات الأخبار ، تلعب ويكيبيديا أيضًا المشكلة التي تفيد بأن شركات الذكاء الاصطناعى تتطور بسرعة إلى مصادر تنافسية للمعلومات. نظرًا لأن استخدام chatbots لجمع المعلومات يصبح مزيد من الإقرار ، فإن عادة استشارات مواقع الأخبار و Wikipedia أصبحت تدريجياً في الإهمال. “على المدى الطويل ، فإن خطر أن يضمن روبوتات الذكاء الاصطناعى أن زيارة مواقع الويب مثل ويكيبيديا لم تعد ضرورية” ، كما تكتب نيوتن ، وأن ويكيبيديا نفسها لم تعد قادرة على الاستمرار “. التي جفتها الروبوتات مع المصدر الذي يشربونه أيضًا.
