تاريخ النشر: 22 مايو 2025
يغيّر الذكاء الاصطناعي طريقة إنشاء مطوّري الويب للمواقع الإلكترونية وتطبيقات الويب. في مؤتمر Google I/O لعام 2025، شاركنا آخر الأخبار حول ما عملنا عليه خلال العام الماضي، وأوضحنا كيف يستفيد شركاؤنا من الذكاء الاصطناعي على الويب، وأعلنّا عن واجهات برمجة تطبيقات جديدة مدمجة للذكاء الاصطناعي.
هل فاتك الحدث؟ يسرّنا إعلامك بأنّه أصبح بإمكانك مشاهدة المحادثات عند الطلب.
ذكاء اصطناعي عملي مدمج في Chrome باستخدام Gemini Nano
مهمتنا الأساسية هي جعل Chrome والويب أكثر ذكاءً لجميع المطوّرين وجميع المستخدمين. في هذه الجلسة، يقدّم توماس شتاينر آخر الأخبار حول الذكاء الاصطناعي المضمّن، وحالات الاستخدام العملية، ونظرة على مستقبلنا.
يعمل الذكاء الاصطناعي المضمّن على تشغيل النماذج من جهة العميل في المتصفّح، ما يوفّر العديد من المزايا:
- خاصة: تبقى بيانات المستخدمين الحساسة على الجهاز، ولا تحتاج إلى مغادرة المتصفّح مطلقًا.
- بلا إنترنت: يمكن للتطبيقات الوصول إلى إمكانات الذكاء الاصطناعي، حتى بدون اتصال بالإنترنت.
- الأداء العالي: بفضل تسريع الأجهزة، تقدّم واجهات برمجة التطبيقات هذه أداءً ممتازًا.
يمكنك الاطّلاع على عيّنات التعليمات البرمجية لكل واجهات برمجة التطبيقات المضمّنة المستندة إلى الذكاء الاصطناعي، والحصول على آخر الأخبار بشأن حالتها، والاطّلاع على الشركات التي تستخدم هذه التكنولوجيا.
واجهات برمجة التطبيقات المتعدّدة الوسائط
نعمل على تطوير واجهات برمجة تطبيقات جديدة متعددة الوسائط. يعني ذلك أنّه يمكنك سؤال Gemini Nano عن المحتوى المرئي الذي "يراه" أو المحتوى الصوتي الذي "يسمعه". على سبيل المثال، يمكنك الحصول على اقتراحات لنص بديل على الصور المحمَّلة على منصة تدوين، ويمكن للمستخدمين تحسينها وتعديلها. يمكنك أيضًا أن تطلب من Gemini Nano كتابة أوصاف أو نصوص لبرامج البودكاست.
الذكاء الاصطناعي المختلط
أحد التحديات التي يواجهها المطوّرون عند استخدام الذكاء الاصطناعي من جهة العميل هو أنّ بعض الأنظمة الأساسية والمتصفّحات لا تستوفي متطلبات الأجهزة لتشغيل نموذج على الجهاز. تعاونت Gemini مع Firebase لإنشاء حزمة تطوير البرامج (SDK) على الويب من Firebase، ما يتيح لك استخدام Gemini Nano على خادم في حال عدم توفّر عمليات التنفيذ من جهة العميل.
العمل معك
يسرّنا أنّنا عملنا مع العديد من المطوّرين على واجهات برمجة التطبيقات المضمّنة المستندة إلى الذكاء الاصطناعي. لن نتمكّن من تحقيق أهدافنا بدون دعمك.
- برنامج المعاينة المبكرة: انضمّ أكثر من 16,000 مطوّر إلى EPP، واختبروا واجهات برمجة تطبيقات جديدة، واكتشفوا حالات استخدام جديدة، وقدّموا ملاحظات للمساعدة في إنشاء ذكاء اصطناعي أفضل للويب.
- فعاليات "هاكاثون": استضفنا فعاليتَي "هاكاثون"، وأنشأتم مواقع إلكترونية وإضافات رائعة.
لم ينتهِ عملك بعد. يُرجى مواصلة مشاركة ملاحظاتك وتجربة واجهات برمجة التطبيقات الجديدة المضمّنة، وسنواصل إجراء التحسينات. يمكنك حتى المساعدة في توحيد هذه الواجهات من خلال الانضمام إلى مجموعة Web Machine Learning Community Group التابعة لاتحاد شبكة الويب العالمية (W3C).
مستقبل إضافات Chrome مع "Gemini في متصفّحك"
تضاعف عدد الإضافات المستندة إلى الذكاء الاصطناعي خلال العامَين الماضيين. في الواقع، تستخدم% 10 من جميع الإضافات المثبَّتة من "سوق Chrome الإلكتروني" الذكاء الاصطناعي. في هذه المحادثة، يقدّم "سيباستيان بينز" أمثلة عملية توضّح سبب كون إضافات Chrome وGemini مزيجًا فعّالاً.
وتتراوح الأمثلة بين كيفية جعل المتصفّح أكثر فائدة من خلال استخراج البيانات ومعالجتها من المواقع الإلكترونية على الجهاز باستخدام واجهة برمجة التطبيقات الجديدة التي أطلقها Chrome.
عرض إمكانات جديدة متعددة الوسائط في واجهة برمجة التطبيقات الخاصة بطلبات Chrome في "إضافات Chrome" لتسهيل وصول المستخدمين إلى الصوت والصور
لإلقاء نظرة على مستقبل التصفّح من خلال شرح كيفية استخدام مشروع Mariner من Google DeepMind لإضافات Chrome وأحدث واجهات Gemini Cloud API لإنشاء وكيل متصفّح متكامل.
استكشِف إمكانية استخدام Gemini في السحابة الإلكترونية أو في المتصفّح ضمن إضافات Chrome لإنشاء تجارب تصفّح جديدة وجعل المتصفّح أكثر فائدة.
حالات استخدام الذكاء الاصطناعي على الويب واستراتيجياته في العالم الحقيقي
قدّمت "يوريكو هيروتا" و"سويثا غوبالاكريشنان" أمثلة واقعية لشركات تستخدم الذكاء الاصطناعي على الويب لتحسين أعمالها وتجربة المستخدم.وسواء كان الحلّ الذي تستخدمه يعتمد على نماذج من جهة العميل أو من جهة الخادم أو على حلّ مختلط، فإنّ الأهم هو الوظائف والميزات الجديدة الرائعة التي توفّرها للمستخدمين في الوقت الحالي.
أضافت منصة BILIBILI ميزة جديدة إلى أحداث البث المباشر للفيديوهات، وهي التعليقات على الشاشة، ما ساهم في زيادة تفاعل المستخدمين. وهي تعرض تعليقات المستخدمين في الوقت الفعلي على الفيديو، وتظهر خلف المتحدث. ولتحقيق ذلك، يستخدمون تجزئة الصور، وهو مفهوم معروف في مجال تعلُّم الآلة. ونتيجةً لذلك، زادت مدة الجلسة بنسبة %30. Tokopedia قلّلت من المشاكل في عملية التحقّق من هوية البائعين باستخدام نموذج للتعرّف على الوجه، وذلك لتقييم جودة الصور التي يتم تحميلها. ونتيجةً لذلك، تمكّنوا من خفض الموافقات اليدوية بنسبة %70 تقريبًا.
Vision Nanny هي منصة على الويب مخصّصة للأطفال الذين يعانون من ضعف البصر الدماغي (CVI)، وتوفّر أنشطة لتحفيز البصر مستنِدة إلى الذكاء الاصطناعي. تستخدم هذه التطبيقات مكتبات متعددة من MediaPipe، بما في ذلك نموذج رصد معالم اليد الذي يحدّد نقاطًا رئيسية في اليدين ضمن صورة أو فيديو أو في الوقت الفعلي. أظهرت تجربة أجريناها على 50 طفلاً أنّ تطبيق Vision Nanny قدّم ردودًا أسرع 5 مرات من أنشطة التحفيز البصري اليدوية. أفاد المعالجون النفسيون بأنّهم وفّروا ثلاث ساعات في المتوسط لكل جلسة من خلال إزالة عملية الإعداد اليدوي.
يتضمّن Google Meet عدة ميزات مستنِدة إلى الذكاء الاصطناعي، بدءًا من تحسين الإضاءة وصولاً إلى الحد من تشويش الفيديوهات. ويتمثل التحدي الأكبر في أنّ هذه الميزات يجب أن تعمل في الوقت الفعلي. هنا يأتي دور WebAssembly (Wasm) للاستفادة من كامل إمكانات وحدة المعالجة المركزية في الكمبيوتر وإتاحة معالجة الفيديو في الوقت الفعلي.
هذه مجرّد أمثلة قليلة على استخدام الذكاء الاصطناعي على الويب. جرّبت عدة شركات أخرى واجهات برمجة التطبيقات المضمّنة المستندة إلى الذكاء الاصطناعي، وشارك بعضها أعماله في دراسات حالة.
وكلاء الذكاء الاصطناعي على الويب من جهة العميل لإنشاء تجارب مستخدم أكثر ذكاءً في المستقبل
تحدّث جايسون مايز عن مستقبل الإنترنت، أي برامج الذكاء الاصطناعي الوكيلة على الويب. سيشهد الويب مستقبلًا قائمًا على الوكلاء، إذ ستتوفّر إمكانات الذكاء الاصطناعي مباشرةً في المتصفّح لتنفيذ مهام مفيدة نيابةً عنك، ما يتجاوز إمكانات النماذج اللغوية الكبيرة.
من خلال استخدام طريقة من جهة العميل، يمكنك الاستفادة من خصوصية محسّنة ووقت استجابة أقل، بالإضافة إلى إمكانية تحقيق وفورات كبيرة في التكاليف. تتيح لك الوكلاء ترقية موقعك الإلكتروني الحالي لتنفيذ المهام بشكل مستقل نيابةً عن المستخدم، مع اختيار الأدوات المتاحة واستخدامها بشكل ديناميكي، وربما في حلقة، ما يسمح للوكيل بإكمال المهام التي قد تكون معقّدة أو متعدّدة الخطوات.
يمكن لموظّفي الدعم إجراء ما يلي:
- التخطيط وتقسيم المهام الفرعية: يمكن التعامل مع المشاكل الأكثر تعقيدًا من خلال التخطيط المتعدد الخطوات لتقسيم المهمة إلى خطوات منطقية لإكمالها.
- اختيار أفضل الأدوات، سواء كانت دوال أو استخدام واجهة برمجة تطبيقات أو الوصول إلى مخزن البيانات من أجل تعزيز المعرفة الأساسية للنموذج اللغوي، ثم تنفيذ الإجراءات في العالم الخارجي
- الاحتفاظ بالذاكرة المستندة إلى السياق، استنادًا إلى الردود السابقة من الوكيل أو الأدوات الخارجية تعمل الذاكرة القصيرة المدى كذاكرة مؤقتة بنظام الوارد أولاً الصادر أولاً لسجلّ السياق، بما يصل إلى حجم قدرة الاستيعاب للنموذج، وذلك على عكس الذاكرة الطويلة المدى التي يمكن فيها استخدام قاعدة بيانات متجهة لتخزين المعلومات واسترجاعها عند الحاجة من جلسات المحادثة السابقة أو مصادر البيانات الأخرى بالكامل.
تم تصميم وكلاء الذكاء الاصطناعي على الويب ليتم دمجهم في تقنيات الويب الحالية باستخدام JavaScript. في النهاية، من المهم أن نواصل تسريع أجهزتنا لتشغيل النماذج في المتصفح على أفضل وجه. نتطلّع إلى المستقبل، حيث ستؤدي تكنولوجيات مثل WebNN دورًا رئيسيًا في تحسين تنفيذ النماذج على مستوى وحدات المعالجة المركزية (CPU) ووحدات معالجة الرسومات (GPU) ووحدات المعالجة العصبية (NPU). ومع الاتجاه نحو استخدام نماذج لغوية كبيرة أصغر حجمًا واستمرار التقدّم، ستصبح هذه النماذج أكثر فعالية في المستقبل.
ننصحك باستخدام نهج مختلط يجمع بين المعالجة على الجهاز وعمليات الربط الاستراتيجية بالسحابة الإلكترونية، ما يتيح لك إنشاء تجارب مستخدم ذكية وسريعة الاستجابة ومخصّصة في المتصفّح الآن. في المستقبل القريب، من المفترض أن يؤتي استثمارك في نهج الذكاء الاصطناعي على الويب ثماره مع ازدياد قدرة الأجهزة على تشغيل النماذج اللغوية الكبيرة.
ملخّص لأبرز أحداث مؤتمر Google I/O لعام 2025
لقد نشرنا جميع الجلسات التي عُقدت في مؤتمر Google I/O 2025، مع قائمة تشغيل مخصّصة لمطوّري الويب. يمكنك مشاهدة المزيد على io.google/2025.