ملخص مؤتمر I/O لعام 2024 Web AI: نماذج وأدوات وواجهات برمجة تطبيقات جديدة لتطبيق الويب التالي

لقد حدثت تغييرات كثيرة في الذكاء الاصطناعي على الويب خلال العام الماضي. إذا لم تتمكن من حضور المؤتمر، يمكنك الاطّلاع على محادثتنا التي أجريناها في مؤتمر I/O لعام 2024 حول النماذج والأدوات وواجهات برمجة التطبيقات الجديدة لتطبيق الويب التالي.

الذكاء الاصطناعي على الويب هو مجموعة من التكنولوجيات والأساليب لاستخدام نماذج تعلُّم الآلة (ML) من جهة العميل في متصفّح ويب يعمل على وحدة المعالجة المركزية (CPU) أو وحدة معالجة الرسومات (GPU) للجهاز. ويمكن إنشاء هذه التطبيقات باستخدام JavaScript وتكنولوجيات الويب الأخرى، مثل WebAssembly وWebGPU. يختلف ذلك عن الذكاء الاصطناعي من جهة الخادم أو "الذكاء الاصطناعي من السحابة الإلكترونية"، حيث يتم تنفيذ النموذج على خادم ويتم الوصول إليه باستخدام واجهة برمجة تطبيقات.

في هذه المحادثة، شاركنا ما يلي:

  • كيفية تشغيل النماذج اللغوية الكبيرة الجديدة في المتصفّح وتأثير تشغيل النماذج من جهة العميل
  • نظرة على مستقبل العناصر المرئية ل prototyping بشكل أسرع
  • وكيفية استخدام مطوّري الويب لـ JavaScript في Chrome للعمل مع تكنولوجيات الذكاء الاصطناعي على الويب، على نطاق واسع

النماذج اللغوية الكبيرة في المتصفّح

‫Gemma Web هو نموذج جديد مفتوح من Google يمكن تشغيله في المتصفّح على جهاز المستخدم، وقد تم إنشاؤه استنادًا إلى الأبحاث والتكنولوجيا نفسها المستخدَمة في إنشاء Gemini.

من خلال توفير نموذج لغوي كبير على الجهاز، يمكن تحقيق وفورات كبيرة في التكلفة مقارنةً بتشغيله على خادم في السحابة الإلكترونية لإجراء الاستنتاجات، بالإضافة إلى تحسين خصوصية المستخدم وخفض وقت الاستجابة. لا تزال تقنية الذكاء الاصطناعي التوليدي في المتصفّح في مراحلها الأولى، ولكن مع استمرار تحسين الأجهزة (من خلال زيادة ذاكرة الوصول العشوائي لوحدة المعالجة المركزية ووحدة معالجة الرسومات)، نتوقّع توفّر المزيد من النماذج.

يمكن للأنشطة التجارية إعادة تصور ما يمكنك فعله على صفحة ويب، خاصةً في حالات الاستخدام الخاصة بالمهام، حيث يمكن ضبط أوزان النماذج اللغوية الكبيرة الأصغر حجمًا (من مليارَين إلى 8 مليارات مَعلمة) لتشغيلها على أجهزة المستهلك.

يمكنك تنزيل Gemma 2B على نماذج Kaggle، وهو متاح بتنسيق متوافق مع واجهة برمجة التطبيقات لتحليل النماذج اللغوية الكبيرة على الويب. تشمل التصاميم الأخرى المتوافقة Microsoft Phi-2 وFalcon RW 1B وStable LM 3B، ويمكنك تحويلها إلى تنسيق يمكن لوقت التشغيل استخدامه باستخدام مكتبة المحوِّل.

إنشاء نماذج أولية بشكل أسرع باستخدام Visual Blocks

باستخدام Visual Blocks، يمكنك إجراء عملية تقدير العمق في العميل بدون أي رمز.

نحن نتعاون مع Hugging Face، التي أنشأت 16 عقدة مخصّصة جديدة للكتل المرئية. يتيح ذلك استخدام Transformers.js ومنظومة Hugging Face المتكاملة الأوسع نطاقًا في Visual Blocks.

يتم تشغيل ثماني من هذه العقد الجديدة بالكامل من جهة العميل، باستخدام الذكاء الاصطناعي على الويب، بما في ذلك:

بالإضافة إلى ذلك، هناك سبع مهام تعلُّم آلي من جهة الخادم من Hugging Face تتيح لك تشغيل آلاف النماذج باستخدام واجهات برمجة التطبيقات في Visual Blocks. اطّلِع على مجموعة "الحجبات المرئية للوجوه التي تعانق بعضها".

استخدام JavaScript للذكاء الاصطناعي على الويب على نطاق واسع باستخدام Chrome

في الحالات السابقة، مثل حالة "جيما"، يتم تحميل النموذج وتشغيله داخل صفحة الويب نفسها. يعمل Chrome على تطوير ميزات الذكاء الاصطناعي المدمجة على الجهاز، والتي تتيح لك الوصول إلى النماذج باستخدام واجهتَي برمجة تطبيقات JavaScript معياريتَين ومخصّصتَين للمهام.

ولم نتوقف عن هذا الحدّ. عدّل Chrome أيضًا WebGPU ليتوافق مع قيم النقطة الثابتة التي تبلغ 16 بتًا.

لدى WebAssembly اقتراح جديد، وهو Memory64، لسماح بتحميل نماذج الذكاء الاصطناعي بحجم أكبر مقارنةً بالماضي، وذلك من خلال فهرس الذاكرة بسعة 64 بت.

بدء اختبار نماذج الذكاء الاصطناعي على الويب باستخدام Chrome بدون واجهة مستخدم

يمكنك الآن اختبار الذكاء الاصطناعي من جهة العميل (أو أي تطبيق يحتاج إلى معالجة WebGL أو WebGPU) باستخدام Headless Chrome، مع الاستفادة من وحدات معالجة الرسومات من جهة الخادم لزيادة السرعة، مثل NVIDIA T4 أو P100. اطّلِع على مزيد من المعلومات:

عند مشاركة أعمالك، احرص على إضافة الهاشتاغ #WebAI ليتمكن المنتدى الأوسع من الاطّلاع على أعمالك. شارِك النتائج والاقتراحات على X أو LinkedIn أو منصة الصعق الاجتماعي المفضّلة لديك.