جوجل تقدم طراز Gemini 2.0 الذكي.. سرعة فائقة وإمكانيات متقدمة
كشفت شركة جوجل عن الجيل الجديد من موديلاتها الذكية Gemini 2.0 بتحديثات متقدمة وأداء فائق السرعة وإمكانيات متقدمة، مقارنة بالجيلين السابقين Gemini 1.5 وGemini 1.0.
يأتي ذلك كجزء من جهود عملاق التكنولوجيا للحفاظ على قدرتها التنافسية في مجال الذكاء الاصطناعي ضد الشركات العملاقة مثل Meta وMicrosoft وOpenAI.
وبحسب تدوينة رسمية من جوجل، فإن الإصدار الأول من الجيل الجديد سيكون الإصدار الخفيف Gemini 2.0 Flash، وهو مزود بالقدرة على فهم المدخلات الرسومية مثل الصور ومقاطع الفيديو والنصوص والأصوات، بالإضافة إلى القدرة لإخراجها في إنتاج أشكال مختلفة.
وقدمت الشركة مجموعة من المشاريع التجريبية التي يدعمها إصدار Gemini 2.0 Flash الجديد، مثل المساعد البرمجي Project Mariner المتخصص بتسهيل استخدام متصفح Chrome تلقائياً لأداء مهام المستخدم، والمساعد الذكي لكتابة الأكواد Jules، وكما المساعد الصوتي الذكي Project Astra، الذي يجيب على أسئلة المستخدم ويفهم العالم ويدركه من خلال عدسة الهواتف المزودة بكاميرات والنظارات الذكية.
الجوزاء 2.0 فلاش
صممت جوجل نموذج Gemini 2.0 Flash الجديد استنادًا إلى الجيل السابق Gemini 1.5 Flash، مع أداء واستجابة متقدمين للتعامل مع المهام ومعالجة البيانات المختلفة، وهو أسرع مرتين من أداء Gemini 1.5 Pro.
ويأتي النموذج الجديد مزودًا بقدرات مثل القدرة على التعامل مع أشكال مختلفة من المدخلات الرسومية مثل الصور ومقاطع الفيديو والأصوات، بالإضافة إلى اكتساب قدرات جديدة لإنتاج المحتوى من الصور والأصوات، وتحويل النصوص إلى كلام منطوق.
بالإضافة إلى ذلك، يمكن لـ Gemini 2.0 Flash استخدام أدوات متنوعة، مثل خرائط Google وبحث Google، بالإضافة إلى تنفيذ التعليمات البرمجية وتنفيذ أوامر المستخدم باستخدام تطبيقات الطرف الثالث.
يتوفر Gemini 2.0 Flash حاليًا في مرحلة تجريبية للمطورين ضمن Gemini API، وعلى Google AI Studio ومنصة Vertex AI، وسيكون التوفر العام الرسمي في يناير من العام المقبل.
ولتسهيل استخدام المطورين للنموذج الجديد في تطوير التطبيقات والتجارب التفاعلية، أطلقت جوجل أيضًا واجهة برمجة تعرف باسم Multimodal Live API، والتي تمكن من تطوير التجارب والتطبيقات، مما يسمح للتجارب الذكية بأخذ تصور المدخلات المختلفة، مثل الأصوات ومقاطع الفيديو الحية، بالإضافة إلى القدرة على استخدام العديد من الأدوات الرقمية.
ويتوفر نموذج Gemini 2.0 Flash الجديد أيضًا على موقع Gemini على أجهزة الكمبيوتر الشخصية ومتصفحات الهاتف المحمول، وسيتوفر قريبًا في تطبيقات Gemini للهواتف الذكية.
أما بالنسبة لخدمات جوجل، فستعمل الشركة على تحسين قدرات وظيفة البحث الذكي الخاصة بها AI Overview، من خلال إضافة النموذج الجديد إلى محرك بحث جوجل حتى يتمكن من فهم استفسارات المستخدمين من حيث الأسئلة والقدرة على الإجابة عليها. على الرغم من أنها أسئلة معقدة تتطلب عدة خطوات للإجابة عنها، بالإضافة إلى… منحه القدرة على حل المعادلات الرياضية المتقدمة وكتابة الرموز.
ستظهر هذه الإمكانات في النظرة العامة على الذكاء الاصطناعي ضمن بحث جوجل هذا الأسبوع، مع توفرها على نطاق أوسع عالميًا بحلول عام 2025.
ووعدت جوجل بإضافة Gemini 2.0 Flash إلى المزيد من خدماتها وستقدم ميزة نظرة عامة على الذكاء الاصطناعي في جميع أنحاء العالم بعدة لغات العام المقبل.
وكلاء الجوزاء الرقميون
وضعت جوجل فكرة الوكلاء الرقميين (AI Agents) في قلب تطوير الجيل الثاني من جيميني.
وقال ساندر بيتشاي، الرئيس التنفيذي لشركة جوجل، إن فكرة الوكلاء الرقميين شغلت الشركة منذ العام الماضي، وأنها عملت بشكل مكثف على الاستثمار في المشاريع البحثية والنماذج الذكية التي “تركز على تقديم ذكاء اصطناعي قادر على فهم العالم من حولنا”. المستخدم، وتحليل وإدراك البيانات المختلفة بأشكالها المختلفة. “حتى يتمكن من تحليل المواقف وتوقع مسارها في خطوات مختلفة، ومن ثم اتخاذ القرارات نيابة عن المستخدم، ولكن تحت إشرافه”.
وهذا بالضبط ما تقدمه جوجل مع Gemini 2.0 Flash والمشاريع البرمجية التجريبية المبنية عليه وأولها مشروع Astra الذي استعرضته الشركة لأول مرة في مؤتمر المطورين I/O 2024 في أبريل الماضي، حيث يقدم الذكاء الاصطناعي الذي يقوم بإنشاء الصور، ويمكنه فهم مقاطع الفيديو والأصوات واللغات التي يمكن الوصول إليها من خلاله. في الشكل المباشر، يتكون هاتف المستخدم من مكونات إلكترونية مثل الميكروفون والكاميرا.
وعند تلقي هذه المدخلات، يستجيب النموذج بإجابات دقيقة من خلال القدرة على البحث في الويب عبر بحث جوجل، والوصول إلى البيانات الجغرافية المكانية الدقيقة من خلال اعتماده على خرائط جوجل، بالإضافة إلى القدرة على استخدام وظيفة البحث المرئي لـ Google Lens. كما أنه يتمتع بذاكرة قوية للمحادثات مع المستخدم، بالإضافة إلى ذاكرة قصيرة المدى تصل إلى 10 دقائق، ليتمكن من مواصلة مناقشة التفاصيل المختلفة خلال نفس جلسة الاستخدام.
وتحاول جوجل تقديم هذه الإمكانيات المميزة على متن بعض منتجاتها مثل تطبيق Gemini للهواتف الذكية وبعض النظارات الذكية.
تعمل شركة جوجل مع سامسونج وكوالكوم على النظارات الذكية، والتي من المتوقع أن يتم إطلاقها العام المقبل.
وبالإضافة إلى مشروعها “أسترا”، تركز “جوجل” كمساعد افتراضي يعتمد على الذكاء الاصطناعي للوسائط المتعددة، من خلال مشروعها التجريبي “مشروع مارينر”، على توفير عوامل ذكية يمكنها المساعدة في أداء مهام متعددة للمستخدم. في متصفح جوجل كروم.
ويتيح المشروع التجريبي الجديد للمستخدم استخدام الوكيل الذكي للتفاعل مع عناصر الشاشة بما في ذلك الصور والنصوص والأزرار والتعليمات البرمجية في نافذة المتصفح، مما يسمح للمستخدم بإصدار أمر محدد والوكيل الذكي للتحرك داخل نافذة المتصفح. النافذة، قم بالكتابة والبحث لتنفيذ تلك المهمة، مع العودة إلى المستخدم للتأكيد. لإكمال العملية إذا كانت المشكلة حساسة، مثل الشراء عبر الإنترنت.
حصلت خدمة Google التجريبية، وهي إضافة تجريبية لمتصفح Chrome، على تقييم 83.5%، وفقًا لمقياس WebVoyager المخصص لاختبار قدرات الوكلاء الرقميين على أداء المهام على الإنترنت.
وعلى الرغم من إمكانياته الفريدة، فإن عمل الوكيل الرقمي Project Mariner يتعرض للأخطاء وبعض التأخيرات، وهو ما وعدت جوجل بتحسينه بمرور الوقت.
طورت شركة جوجل مساعداً ذكياً لكتابة الأكواد البرمجية يسمى Jules، يساعد في تحديد المعضلة أو المهمة البرمجية المطلوب تنفيذها، ومن ثم يبدأ العمل على حلها من خلال كتابة الأكواد، ومن ثم تنفيذها، تحت إشراف كامل من المبرمج البشري.
بفضل عامل البرمجة النصية الذكي التجريبي، يمكن إضافته إلى بيئة البرمجة، مثل GitHub.
وعلى مستوى الألعاب، عمل فريق Google DeepMind على تطوير جيل جديد من المساعدين الأذكياء لإنشاء عوالم الألعاب الرقمية، Genie، الذي يساعد في تصميم عوالم ثلاثية الأبعاد لألعاب الفيديو، مع القدرة على تصميم الشخصيات الرقمية في الألعاب، والتي يساعد اللاعبين على التنقل داخل الألعاب ومساعدتهم على تخطي العقبات من خلال المساعدة في تطوير استراتيجيات لإكمال المهام.