جوجل تفاجئ الجميع بإصدار Gemini في وضع God Mode: هكذا تعمل الذكاء الاصطناعي البصري في الوقت الفعلي

  • يمكن لـGemini الآن تحليل ما تراه على شاشة هاتفك أو الكاميرا في الوقت الفعلي.
  • يعتمد وضع الله على التكامل مع مشروع أسترا، وهي تقنية متعددة الوسائط من جوجل.
  • يعمل على حل المشكلات التقنية أو التعليمية أو تحليل المحتوى المرئي بشكل فوري.
  • متاح حاليًا فقط لمشتركي Google One، مع إمكانية التوسع في المستقبل.

ميزة God Mode في Gemini AI من Google

جوجل لقد شهدت تقنية الذكاء الاصطناعي مرة أخرى تطوراً ملحوظاً في عالم ما قبل وما بعد، وذلك من خلال ميزة تبدو وكأنها مأخوذة مباشرة من فيلم خيال علمي: ما يسمى بـ "وضع الإله" في برج الجوزاء. وقد حاز هذا التقدم الجديد على اهتمام المستخدمين والمطورين وخبراء التكنولوجيا بفضل نهجه الثوري الذي يسمح للذكاء الاصطناعي بتفسير المعلومات المرئية مباشرة من شاشة الهاتف المحمول أو الكاميرا.

تجمع هذه الأداة المبتكرة بين قوة اللغة الطبيعية والرؤية في الوقت الفعلي، وضع الأساس لما يمكن أن يكون الجيل القادم من المساعدين الرقميين. وبالتالي، فإننا لا نتحدث عن تطور في القدرات فحسب، بل أيضًا عن تحول كامل في طريقة تفاعل المستخدمين مع الذكاء الاصطناعي من جوجل.

ما هو وضع إله الجوزاء؟

Google Gemini مع إمكانية الوصول المرئي في الوقت الفعلي

وضع إله الجوزاء هو ميزة جديدة طورتها جوجل والتي تأخذ التفاعلات مع الذكاء الاصطناعي إلى المستوى التالي. تتيح هذه الميزة، عند تفعيلها، لجهاز Gemini القدرة على الوصول إلى المحتوى وتحليله في الوقت الفعلي من شاشة الجهاز والكاميرا. أصبحت هذه الوظيفة ممكنة بفضل التكامل مشروع أسترا، وهو مشروع طموح قدمته شركة جوجل منذ حوالي عام.

يوفر مشروع أسترا الذكاء الاصطناعي ما يسمى بالإدراك المتعدد الوسائط، أي القدرة على فهم وتفسير البيانات من مصادر مختلفة مثل النصوص والصور والفيديو. بفضل هذا الأساس، يتيح وضع God Mode لجهاز Gemini ليس فقط معالجة اللغة المنطوقة أو المكتوبة، بل أيضًا تفسيرها والرد عليها بناءً على ما يراه في الوقت الفعلي على الشاشة أو من خلال كاميرا الهاتف.

الوظائف الرئيسية لوضع الله

التحليل البصري في الوقت الحقيقي مع Gemini

يؤدي تنشيط وضع الله إلى إضافة ميزتين رئيسيتين إلى الجوزاء تعملان على تغيير طريقة عمله بشكل جذري:

  • تسجيل الشاشة في الوقت الحقيقي: يتيح هذا الخيار للمستخدمين بدء جلسة تسجيل باستخدام زر مخصص داخل تطبيق Gemini. وبمجرد تفعيلها، سيكون الذكاء الاصطناعي قادرًا على رؤية ما يحدث بالضبط على شاشة الجهاز. سواء كنت تتصفح موقعًا على الويب، أو تشاهد مقطع فيديو، أو تلعب لعبتك المفضلة، يمكن لـ Gemini متابعة المحتوى وتقديم ردود أو تفسيرات بناءً على ما يراه.
  • الوصول إلى الكاميرا الحية: بفضل هذه الميزة الإضافية، يستطيع تطبيق Gemini الوصول إلى كاميرا الهاتف لمراقبة المناطق المحيطة أو أحد الأشياء المثيرة للاهتمام. وهذا يسمح له بإنشاء استجابات بناءً على ما يراه، مثل تحديد كائن ما، أو تقديم معلومات حول لوحة، أو شرح كيفية عمل جهاز، أو مساعدتك في حل مشكلة فنية في المنزل.
  تستثمر شركة Nvidia 2.000 مليار دولار في شركة Synopsys لتعزيز التزامها بالذكاء الاصطناعي

الأمر الأكثر إثارة للاهتمام هو أنه خلال هذه التجربة البصرية، يمكن للمستخدم إجراء محادثات كما يفعل عادةً مع روبوت المحادثة، ولكن الآن مع مستوى أعمق وأكثر سياقًا من التفاعل. تفهم الذكاء الاصطناعي ما يحدث بصريًا، مما يلغي الحاجة إلى تفسيرات مكتوبة أو شفهية طويلة من المستخدم.

الاستخدامات العملية لوضع إله الجوزاء

يفتح هذا النوع من التكنولوجيا مجموعة كاملة من الاحتمالات الجديدة والتطبيقات العملية، لكل من المستخدمين الفرديين والبيئات المهنية. يمكن أن يكون أحد القطاعات الأكثر فائدة هو قطاع التعليم، حيث يمكن لـ Gemini استخدام God Mode لتحليل مقاطع الفيديو التعليمية في الوقت الفعلي، أو شرح المفاهيم المرئية، أو المساعدة في فهم الرسومات والرسوم التوضيحية.

وفي القطاع المهني، قد يكون التحليل المرئي في الوقت الفعلي مفيدًا للفنيين أو المطورين أو المصممين الذين يحتاجون إلى حل الأخطاء أو تلقي المساعدة في الوقت الفعلي دون الحاجة إلى كتابة تقارير أو تفسيرات طويلة. كل ما عليك فعله هو إظهار المكون المتأثر لكاميرا هاتفك، وسيقوم برنامج Gemini بتحليل ما يراه لتقديم المشورة الفنية. يمكنك أيضًا مشاهدة المقال حول الجوزاء وأفضل ميزاته المجانية لمزيد من التفاصيل حول قدراته.

وفي عالم الترفيه أو استهلاك الوسائط المتعددة أيضًا، قد يكون God Mode حليفًا رائعًا. عند مشاهدة فيلم أو مسلسل أو حتى مقطع فيديو للعبة، يمكنك طرح أسئلة على المساعد حول تفاصيل المحتوى أو المراجع أو كيفية عمل أحد العناصر على الشاشة. تجعل هذه التجربة بأكملها استخدام Gemini أكثر سهولة وطبيعية واكتمالاً.

وبالإضافة إلى ذلك، يمكن استخدام هذه الميزة لمساعدة المستخدمين ذوي الخبرة التكنولوجية المحدودة، توجيههم خطوة بخطوة من خلال التعرف البصري على الواجهات غير المألوفة، أو البرامج التعليمية البصرية، أو إعداد الجهاز دون الحاجة إلى البحث عن تعليمات معقدة. لاستكشاف المزيد حول كيفية قدرة الجوزاء على تحويل تفاعلك مع التكنولوجيا، تفضل بزيارة الجوزاء على Android Auto.

  ChatGPT يبلغ عامه الثالث: كيف تغيرت علاقتنا بالذكاء الاصطناعي

على الرغم من مدى ابتكار وضع الله، إلا أن هذه الميزة غير متاحة لجميع المستخدمين على الفور. بدأت Google الآن في طرح هذه الإمكانية لمشتركي Google One. هؤلاء المستخدمون الدافعون، وخاصة أولئك الذين لديهم إصدار Gemini Advanced، هم أول من يختبر هذه الميزة.

يرجع ذلك إلى أن وضع الله يتطلب قدرًا كبيرًا من المعالجة والموارد، نظرًا لأن التفسيرات المرئية في الوقت الفعلي تنطوي على استخدام كبير لوحدات معالجة الرسومات والخوادم. ولهذا السبب، قامت جوجل بتقييد إمكانية الوصول إلى هذه الخدمة في الوقت الحالي، على الرغم من أنه لا يستبعد إمكانية توسيع نطاقها لتشمل المستخدمين المجانيين في المستقبل بعد إجراء التحسينات. لمزيد من المعلومات حول تطورها، يمكنك القراءة عن الجوزاء 2.5.

تتضمن متطلبات تفعيل هذه الوظائف ما يلي:

  • قم بتثبيت الإصدار الأحدث من تطبيق Gemini.
  • انتقل إلى قائمة الإعدادات وابحث عن "الخيارات المتقدمة".
  • قم بتمكين تسجيل الشاشة أو استخدام كاميرا الجهاز يدويًا.

بمجرد تفعيلها، ستكون الميزات متاحة في كل مرة تقوم فيها بتسجيل الدخول إلى Gemini، مما يسمح بتجربة أكثر ثراءً وتفاعلية.

كيف يختلف Gemini عن الذكاء الاصطناعي الآخر؟

وقد أدى الإعلان عن هذه الميزة إلى إجراء مقارنات بين Gemini ونماذج الذكاء الاصطناعي الأخرى الرائدة في السوق، مثل تلك الخاصة بـ OpenAI. وبينما تعمل هذه الشركات أيضًا على تطوير قدرات مماثلة، يبدو أن نهج جوجل يميل أكثر نحو سهولة الاستخدام، والفائدة اليومية، وإمكانية الوصول.

وبحسب الخبراء في القطاع، تم تصميم دمج مشروع أسترا في جيميني ليكون قابلاً للتطبيق العملي، وليس فقط كدليل على القوة التقنية. إن القرار بالسماح بالاستخدام المجاني لبعض الميزات المدفوعة مسبقًا هو نقطة أخرى لصالح جوجل في خفض حاجز الدخول. يتماشى هذا النهج مع هدف Google المتمثل في جعل Gemini في متناول الجميع وفعالًا.

  تطلب جوجل تأجيل الأمر الذي يجبرها على مشاركة البيانات مع المنافسين.

بالإضافة إلى ذلك، يسمح تصميم النظام بدمج الميزات المرئية بشكل طبيعي في تجربة المستخدم، والتي يمكن أن توفر ميزة تنافسية على حلول الذكاء الاصطناعي الأخرى الموجودة في السوق. إن قدراتها الحوارية السياقية، إلى جانب تفسيرها البصري، تضع Gemini كذكاء اصطناعي أقرب إلى ما يمكن أن يكون ذكاء اصطناعيًا عامًا وتفاعليًا حقًا.

طوال عام 2025، أظهرت شركة جوجل أنها لا تنوي إبطاء وتيرة تحديثاتها. ويشير النمو المستدام للميزات المتقدمة بشكل متزايد إلى أن جيميني قد يصبح المعيار الفعلي للمساعدين الشخصيين الأذكياء.

يمثل تنفيذ God Mode تحولاً عميقاً في كيفية الاستفادة من الذكاء الاصطناعي في الحياة اليومية. إنها ليست مجرد إضافة جديدة، بل هي خطوة واضحة نحو التكامل الكامل بين البشر والآلات.

نحن نشهد قفزة تطورية في طريقة تفاعلنا مع التكنولوجيا، الذي لم يعد يفهم ما نقوله فقط، بل ما نراه أيضًا. وهذا يمثل، بلا شك، بداية عصر جديد في مجال الذكاء الاصطناعي.

مصدر: إنفورماتيك ديجيتال

جوجل تطلق ميزة Gemini وتضع ChatGPT في خطر
المادة ذات الصلة:
تطبيق Gemini Deep Research متاح الآن لأجهزة iPhone: هكذا يعمل الذكاء الاصطناعي الجديد من Google