वेब पर एआई मॉडल की मदद से सुविधाएं तैयार करते समय, हम बड़े मॉडल के लिए अक्सर सर्वर साइड से मिलने वाले समाधानों का इस्तेमाल करते हैं. ऐसा खास तौर पर जनरेटिव एआई के लिए होता है, जहां सबसे छोटे मॉडल भी मीडियन वेब पेज साइज़ से हज़ारों गुना बड़े होते हैं. यह बात एआई के इस्तेमाल के अन्य उदाहरणों पर भी लागू होती है, जहां मॉडल 10 से 100 मेगाबाइट तक के हो सकते हैं.
ये मॉडल सभी वेबसाइटों पर शेयर नहीं किए जाते. इसलिए, पेज लोड होने पर हर साइट को इन्हें डाउनलोड करना पड़ता है. यह डेवलपर और उपयोगकर्ताओं के लिए एक ऐसा समाधान है जिसे
बड़े मॉडल के लिए, सर्वर साइड एआई एक बेहतरीन विकल्प है. हालांकि, डिवाइस पर काम करने वाले और हाइब्रिड मॉडल के तरीकों के अपने दिलचस्प फ़ायदे हैं. इन तरीकों को कारगर बनाने के लिए, हमें मॉडल के साइज़ और मॉडल की डिलीवरी पर ध्यान देना होगा.
इसलिए, हम वेब प्लैटफ़ॉर्म एपीआई और ब्राउज़र से जुड़ी सुविधाएं डेवलप कर रहे हैं. इन्हें एआई मॉडल के साथ-साथ, लार्ज लैंग्वेज मॉडल (एलएलएम) को सीधे ब्राउज़र में इंटिग्रेट करने के लिए डिज़ाइन किया गया है. इसमें Gemini Nano भी शामिल है. यह एलएलएम के Gemini का सबसे बेहतर वर्शन है. इसे ज़्यादातर आधुनिक डेस्कटॉप और लैपटॉप कंप्यूटर पर चलने के लिए डिज़ाइन किया गया है. पहले से मौजूद एआई की मदद से, आपकी वेबसाइट या वेब ऐप्लिकेशन से एआई की मदद से काम किए जा सकते हैं. इसके लिए, आपको अपने एआई मॉडल डिप्लॉय या मैनेज करने की ज़रूरत नहीं है.
पहले से मौजूद एआई के फ़ायदों और इस टेक्नोलॉजी को लागू करने के प्लान के बारे में जानें. साथ ही, यह भी जानें कि इस टेक्नोलॉजी का फ़ायदा कैसे लिया जा सकता है.
रिलीज़ से पहले झलक देखें
एपीआई को बेहतर बनाने, यह पक्का करने के लिए कि वे आपके इस्तेमाल के उदाहरण को पूरा करें, और स्टैंडर्ड तय करने के लिए अन्य ब्राउज़र वेंडर के साथ हुई बातचीत के बारे में हमें बताने के लिए, हमें आपके इनपुट की ज़रूरत है.
हमारे Early Preview प्रोग्राम में शामिल हों, ताकि पहले से मौजूद एआई के उन आइडिया पर सुझाव या राय दी जा सके जो शुरुआती चरण में हैं. साथ ही, लोकल प्रोटोटाइपिंग के ज़रिए, पहले से चल रहे एपीआई को टेस्ट करने के अवसरों के बारे में भी जानें.
नए एपीआई उपलब्ध होने पर सूचना पाने के लिए, Chrome AI के डेवलपर के लिए सार्वजनिक सूचना ग्रुप में शामिल हों.
वेब डेवलपर के लिए पहले से मौजूद एआई (AI) के फ़ायदे
पहले से मौजूद एआई की मदद से आपका ब्राउज़र, बुनियादी और विशेषज्ञ मॉडल उपलब्ध कराता है और उन्हें मैनेज करता है.
डिवाइस पर मौजूद एआई के मुकाबले, पहले से मौजूद एआई के ये फ़ायदे हैं:
- डिप्लॉयमेंट में आसानी: जब ब्राउज़र मॉडल को डिस्ट्रिब्यूट करता है, तब यह डिवाइस की क्षमता को ध्यान में रखता है और मॉडल के अपडेट मैनेज करता है. इसका मतलब है कि नेटवर्क पर बड़े मॉडल को डाउनलोड या अपडेट करने की ज़िम्मेदारी आपकी नहीं है. आपको स्टोरेज खाली करने, रनटाइम का स्टोरेज बजट, विज्ञापन दिखाने की लागत, और अन्य चुनौतियों से निपटने की ज़रूरत नहीं है.
- हार्डवेयर से तेज़ी लाने की सुविधा का ऐक्सेस: ब्राउज़र के एआई रनटाइम को इस तरह से ऑप्टिमाइज़ किया गया है कि वह उपलब्ध हार्डवेयर का ज़्यादा से ज़्यादा फ़ायदा ले सके. जैसे, जीपीयू, एनपीयू या सीपीयू का इस्तेमाल करना. इससे, आपका ऐप्लिकेशन हर डिवाइस पर सबसे अच्छी परफ़ॉर्मेंस मिल सकता है.
डिवाइस पर दौड़ने के फ़ायदे
पहले से मौजूद एआई की मदद से, डिवाइस पर एआई के टास्क करना अब आसान हो जाता है. इससे ये फ़ायदे मिलते हैं:
- संवेदनशील जानकारी को स्थानीय तौर पर प्रोसेस करना: डिवाइस में मौजूद एआई (AI), आपकी निजता की कहानी को बेहतर बना सकता है. उदाहरण के लिए, अगर संवेदनशील जानकारी का इस्तेमाल किया जा रहा है, तो अपने उपयोगकर्ताओं को पूरी तरह सुरक्षित (E2EE) करने की सुविधा वाली एआई सुविधाएं दी जा सकती हैं.
- सक्रिय उपयोगकर्ता अनुभव: कुछ मामलों में, सर्वर पर दोतरफ़ा यात्रा करने का मतलब है कि आप तुरंत नतीजे दे सकते हैं. डिवाइस में मौजूद एआई (AI), बेहतर उपयोगकर्ता अनुभव और बेहतर उपयोगकर्ता अनुभव में अंतर हो सकता है.
- एआई का बेहतर ऐक्सेस: सुविधाओं का ज़्यादा ऐक्सेस पाने के बदले में, आपके उपयोगकर्ताओं के डिवाइस पर कुछ प्रोसेसिंग लोड हो सकती है. उदाहरण के लिए, अगर आपने एआई की प्रीमियम सुविधाएं ऑफ़र की हैं, तो इन सुविधाओं की झलक, डिवाइस में मौजूद एआई की मदद से देखी जा सकती है. इससे संभावित ग्राहकों को अतिरिक्त शुल्क दिए बिना, आपके प्रॉडक्ट के फ़ायदे दिख सकते हैं. इस हाइब्रिड तरीके से, खास तौर पर अक्सर इस्तेमाल होने वाले यूज़र फ़्लो पर अनुमानित खर्च को मैनेज करने में मदद मिलती है.
- ऑफ़लाइन एआई का इस्तेमाल: आपके उपयोगकर्ता इंटरनेट कनेक्शन न होने पर भी, एआई की सुविधाओं को ऐक्सेस कर सकते हैं. इसका मतलब है कि आपकी साइटें और वेब ऐप्लिकेशन ऑफ़लाइन या वैरिएबल कनेक्टिविटी के साथ उम्मीद के मुताबिक काम कर सकते हैं.
हाइब्रिड एआई: उपयोगकर्ता के डिवाइस पर और सर्वर साइड पर
डिवाइस में मौजूद एआई (AI) कई तरह के मामलों को हैंडल कर सकता है. हालांकि, इस्तेमाल के कुछ ऐसे मामले भी होते हैं जिनके लिए सर्वर साइड की मदद की ज़रूरत होती है.
उदाहरण के लिए, हो सकता है कि आपको बड़े मॉडल इस्तेमाल करने पड़ें या कई प्लैटफ़ॉर्म और डिवाइसों पर काम करना पड़े.
इन चीज़ों के आधार पर, हाइब्रिड तरीके का इस्तेमाल किया जा सकता है:
- मुश्किल भरा: डिवाइस पर मौजूद एआई की मदद से, खास और आसानी से इस्तेमाल किए जा सकने वाले काम आसानी से मैनेज किए जा सकते हैं. इस्तेमाल के मुश्किल उदाहरणों के लिए, सर्वर-साइड लागू करें.
- लचीलापन: डिफ़ॉल्ट रूप से सर्वर-साइड का इस्तेमाल करें. साथ ही, डिवाइस के ऑफ़लाइन होने या कनेक्शन में कोई रुकावट होने पर ऑन-डिवाइस का इस्तेमाल करें.
- ग्रेसफ़ुल फ़ॉलबैक: पहले से मौजूद एआई वाले ब्राउज़र इस्तेमाल करने में समय लगेगा. ऐसा हो सकता है कि कुछ मॉडल उपलब्ध न हों. यह भी हो सकता है कि पुराने या कम क्षमता वाले डिवाइस, सभी मॉडल को सही तरीके से चलाने के लिए, हार्डवेयर की ज़रूरी शर्तों को पूरा न करें. इन उपयोगकर्ताओं को सर्वर-साइड एआई उपलब्ध कराएं.
Gemini मॉडल के लिए, बैकएंड इंटिग्रेशन (Python, Go, Node.js या REST के साथ) का इस्तेमाल किया जा सकता है या वेब के लिए Google के एआई क्लाइंट SDK टूल के साथ, वेब ऐप्लिकेशन में लागू किया जा सकता है.
ब्राउज़र आर्किटेक्चर और एपीआई
Chrome में पहले से मौजूद एआई के साथ काम करने के लिए, हमने बुनियादी और विशेषज्ञ मॉडल ऐक्सेस करने के लिए इन्फ़्रास्ट्रक्चर बनाया है, ताकि डिवाइस पर ही एक्ज़ीक्यूशन किया जा सके. यह इन्फ़्रास्ट्रक्चर पहले से ही लिखने में मेरी मदद करो जैसी ब्राउज़र की नई सुविधाएं दे रहा है. साथ ही, यह जल्द ही उपयोगकर्ता के डिवाइस पर एआई के लिए एपीआई की सुविधा भी देगा.
एआई की सुविधाओं को मुख्य रूप से टास्क एपीआई की मदद से ऐक्सेस किया जा सकेगा. जैसे, अनुवाद का एपीआई या खास जानकारी देने वाला एपीआई. Task API को इस तरह डिज़ाइन किया गया है कि वह असाइन करने के लिए, सबसे अच्छे मॉडल के लिए अनुमान चला सके.
Chrome में, ये एपीआई इस तरह बनाए गए हैं कि वे फ़ाइन-ट्यून या विशेषज्ञों वाले मॉडल की मदद से, Gemini Nano से अनुमान लगा सकें. Gemini Nano, ज़्यादातर मॉडर्न डिवाइसों पर काम करने के लिए बनाया गया है. Gemini Nano, भाषा से जुड़े कामों के लिए सबसे सही है. जैसे, खास जानकारी देना, अलग-अलग तरीके से जानकारी देना या कैटगरी तय करना.
साथ ही, हम एक्सप्लोरेट्री एपीआई उपलब्ध कराना चाहते हैं, ताकि आप स्थानीय तौर पर प्रयोग कर सकें. साथ ही, इस्तेमाल के और उदाहरण शेयर कर सकें.
उदाहरण के लिए, हम ये चीज़ें दे सकते हैं:
- Prompt API: पहले से मौजूद लार्ज लैंग्वेज मॉडल (Chrome में Gemini Nano) पर मनचाहे तरीके से कोई टास्क भेजें. इस टास्क को नैचुरल भाषा में लिखा जाएगा.
- फ़ाइन-ट्यूनिंग (LoRA) एपीआई: कम रैंक के हिसाब से बदलाव की सुविधा का इस्तेमाल करके, किसी टास्क पर पहले से मौजूद एलएलएम की परफ़ॉर्मेंस बेहतर बनाएं.
पहले से मौजूद एआई का इस्तेमाल कब करना चाहिए
हमें उम्मीद है कि पहले से मौजूद एआई से आपको और आपके उपयोगकर्ताओं को इन तरीकों से फ़ायदा मिल सकता है:
- एआई की मदद से कॉन्टेंट का बेहतर इस्तेमाल: जैसे, ख़ास जानकारी देना, अनुवाद, कुछ कॉन्टेंट से जुड़े सवालों के जवाब देना, कैटगरी तय करना, और उसकी कैटगरी तय करना.
- एआई की मदद से कॉन्टेंट बनाना: जैसे, लिखने में मदद करना, प्रूफ़रीड करना, व्याकरण में सुधार करना, और अलग तरीके से लिखना.
आगे क्या करना है
शुरुआती स्टेज में पहले से मौजूद AI API के साथ एक्सपेरिमेंट करने के लिए, हमारे रिलीज़ होने से पहले झलक दिखाने वाले प्रोग्राम में शामिल हों.
इस दौरान, Google AI JavaScript SDK के क्विकस्टार्ट में बताया गया है कि अपनी वेबसाइटों और वेब ऐप्लिकेशन के साथ Google के सर्वर पर Gemini Pro को कैसे इस्तेमाल किया जा सकता है.