תחילת העבודה עם AI מובנה

תאריך פרסום: 12 בדצמבר 2024

בעזרת AI מובנה, אפליקציית האינטרנט שלכם יכולה לבצע משימות מבוססות-AI בלי שתצטרכו לפרוס או לנהל מודלים משלכם של AI. צוות ה-AI של Chrome מפתח ממשקי API לפלטפורמת אינטרנט ותכונות בדפדפן שמותאמות למשימות ספציפיות, שמאפשרות לשלב מודלים של AI בדפדפן. אנחנו שואפים שממשקי ה-API האלה יפעלו כשהם יוטמעו בדפדפן, במכשיר של המשתמש.

דרישות

בשלב זה אפשר להשתמש בממשקי ה-API האלה רק ב-Chrome, אבל אנחנו שואפים להפוך אותם לסטנדרטיים בכל הדפדפנים.

דגמים

Prompt API,‏ Summarizer API,‏ Writer API ו-Rewriter API מורידים את Gemini Nano, שנועד לפעול באופן מקומי במחשבים נייחים וניידים. ממשקי ה-API האלה לא פועלים במכשירים ניידים.

נכון לעכשיו, ממשקי ה-API האלה תומכים רק במודל של טקסט לטקסט.

חומרה

ממשקי ה-API של זיהוי השפה והתרגום פועלים ב-Chrome במחשבים ובמכשירי Android.

ממשקי Prompt API,‏ Summarizer API,‏ Writer API ו-Rewriter API פועלים ב-Chrome כשמתקיימים התנאים הבאים:

  • מערכת הפעלה: Windows 10 או 11,‏ macOS מגרסה 13 ואילך (Ventura ואילך) או Linux. עדיין אין תמיכה ב-Chrome ל-Android, ל-iOS ול-ChromeOS בממשקי ה-API שלנו שמבוססים על Gemini Nano.
  • אחסון: נפח אחסון של 22GB לפחות בנפח האחסון שמכיל את פרופיל Chrome.
  • GPU: יותר מ-4GB של RAM.
  • רשת: נתונים ללא הגבלה או חיבור ללא חיוב לפי שימוש.

הדרישות האלה רלוונטיות לכם בתהליך הפיתוח וגם למשתמשים שלכם שעובדים עם התכונות שאתם מפתחים.

מתחילים לפתח

יש מספר ממשקי API מובנים של AI שזמינים בשלבים שונים של פיתוח. חלק מהתכונות זמינות לכל המפתחים בגרסת המקור לניסיון, וחלקן זמינות רק למשתתפים בתוכנית התצוגה המקדימה המוקדמת.

לכל ממשק API יש הוראות משלו לתחילת העבודה ולהורדת המודל, גם ליצירת אב טיפוס מקומי וגם בסביבות ייצור עם גרסת ה-Origin לניסיון.

ממשק Prompt API זמין רק באופן מקומי ובתוספים של Chrome, אבל ממשקי ה-API האחרים פועלים באתרים ובתוספים של Chrome.

שימוש בממשקי API ב-localhost

כל ממשקי ה-API זמינים ב-localhost ב-Chrome. כדי

  1. לעבור אל chrome://flags/#prompt-api-for-gemini-nano.
  2. בוחרים באפשרות מופעל.
  3. לוחצים על הפעלה מחדש או מפעילים מחדש את Chrome.

כדי לוודא ש-Gemini Nano הורדה ופועלת כמצופה, פותחים את DevTools ומקלידים (await ai.assistant.capabilities()).available; במסוף. הפונקציה אמורה להחזיר את הערך readily.

פתרון בעיות ב-localhost

אם Gemini Nano לא פועל כצפוי, יש לבצע את השלבים הבאים:

  1. מפעילים מחדש את Chrome.
  2. לעבור אל chrome://components.
  3. מוודאים שהאפשרות מדריך אופטימיזציה לפי דגם מכשיר קיימת. המשמעות היא ש-Gemini Nano זמין או מוריד.
    • אם לא מופיע מספר גרסה, לוחצים על בדיקת עדכון כדי לאלץ את ההורדה.
  4. פותחים את DevTools ומקלידים (await ai.assistant.capabilities()).available; במסוף. הפונקציה אמורה להחזיר את הערך readily.

אם צריך, ממתינים קצת וחוזרים על השלבים האלה.

תהליך יצירת התקנים

אנחנו פועלים כדי להפוך את ממשקי ה-API האלה לסטנדרטיים, כדי שהם יפעלו בכל הדפדפנים. כלומר, הצענו את ממשקי ה-API לקהילת פלטפורמות האינטרנט והעברנו אותם לקבוצת הקהילה של W3C Web Incubator להמשך דיון.

אנחנו מבקשים משוב מ-W3C, מ-Mozilla ומ-WebKit לגבי כל ממשק API.

מידע נוסף על התהליך הזה לכל ממשק API זמין במסמכי העזרה המתאימים.

יצירת מעורבות ושיתוף משוב

אם תנסו את ה-AI המובנה ותהיה לכם משוב, נשמח לשמוע אותו.