पब्लिश करने की तारीख: 14 मई, 2024, पिछली बार अपडेट किए जाने की तारीख: 13 नवंबर, 2024
जब हम वेब पर एआई मॉडल की मदद से सुविधाएं बनाते हैं, तो अक्सर बड़े मॉडल के लिए, सर्वर-साइड के समाधानों का इस्तेमाल किया जाता है. यह बात खास तौर पर जनरेटिव एआई के लिए सही है. यहां सबसे छोटे मॉडल भी वेब पेज के औसत साइज़ से करीब हज़ार गुना बड़े होते हैं. यह एआई के इस्तेमाल के अन्य उदाहरणों के लिए भी सही है. इनमें मॉडल का साइज़, 10 से 100 मेगाबाइट तक हो सकता है. इन मॉडल को सभी वेबसाइटों पर शेयर नहीं किया जाता. इसलिए, हर साइट को पेज लोड होने पर उन्हें डाउनलोड करना पड़ता है. यह डेवलपर और उपयोगकर्ताओं के लिए सही नहीं है.
हम वेब प्लैटफ़ॉर्म के एपीआई और ब्राउज़र की सुविधाएं डेवलप कर रहे हैं. इनका मकसद, एआई मॉडल को सीधे ब्राउज़र में इंटिग्रेट करना है. इनमें लार्ज लैंग्वेज मॉडल (एलएलएम) भी शामिल हैं. इनमें Gemini Nano भी शामिल है. यह एलएलएम के Gemini फ़ैमिली का सबसे बेहतर वर्शन है. इसे ज़्यादातर आधुनिक डेस्कटॉप और लैपटॉप कंप्यूटर पर स्थानीय तौर पर चलाने के लिए डिज़ाइन किया गया है. पहले से मौजूद एआई की मदद से, आपकी वेबसाइट या वेब ऐप्लिकेशन, एआई की मदद से काम करने वाले टास्क को पूरा कर सकता है. इसके लिए, उसे अपने एआई मॉडल को डिप्लॉय या मैनेज करने की ज़रूरत नहीं होती.
जानें कि पहले से मौजूद एआई के फ़ायदे क्या हैं, इसे लागू करने का हमारा प्लान क्या है, और इस टेक्नोलॉजी का फ़ायदा कैसे लिया जा सकता है.
सार्वजनिक तौर पर उपलब्ध होने से पहले वर्शन का इस्तेमाल करना
एपीआई को बेहतर बनाने के लिए, हमें आपके सुझावों की ज़रूरत है. इससे हमें यह पक्का करने में मदद मिलेगी कि वे आपके इस्तेमाल के उदाहरणों के मुताबिक हों. साथ ही, स्टैंडर्ड बनाने के लिए, अन्य ब्राउज़र वेंडर के साथ हमारी बातचीत में भी मदद मिलेगी.
रिलीज़ होने से पहले सुविधाओं को आज़माने के लिए बने हमारे प्रोग्राम में शामिल हों. इससे, एआई के शुरुआती आइडिया के बारे में सुझाव/राय दी जा सकती है. साथ ही, स्थानीय प्रोटोटाइप के ज़रिए, एपीआई को टेस्ट करने के अवसर भी मिल सकते हैं.
नए एपीआई उपलब्ध होने पर सूचना पाने के लिए, Chrome के एआई डेवलपर के सार्वजनिक एलान वाले ग्रुप में शामिल हों.
वेब डेवलपर के लिए, पहले से मौजूद एआई के फ़ायदे
पहले से मौजूद एआई की मदद से, आपका ब्राउज़र फ़ाउंडेशन और विशेषज्ञ मॉडल उपलब्ध कराता है और उन्हें मैनेज करता है.
क्लाइंट-साइड एआई बनाने के मुकाबले, पहले से मौजूद एआई के ये फ़ायदे हैं:
- डिप्लॉयमेंट में आसानी: ब्राउज़र, मॉडल डिस्ट्रिब्यूट करते समय डिवाइस की क्षमता को ध्यान में रखता है और मॉडल के अपडेट मैनेज करता है. इसका मतलब है कि नेटवर्क पर बड़े मॉडल डाउनलोड करने या अपडेट करने की ज़िम्मेदारी आपकी नहीं है. आपको स्टोरेज खाली करने, रनटाइम मेमोरी बजट, सेवा देने की लागत, और अन्य समस्याओं को हल करने की ज़रूरत नहीं है.
- हार्डवेयर की परफ़ॉर्मेंस बेहतर करने की सुविधा का ऐक्सेस: ब्राउज़र के एआई रनटाइम को ऑप्टिमाइज़ किया गया है, ताकि वह उपलब्ध हार्डवेयर का ज़्यादा से ज़्यादा फ़ायदा ले सके. भले ही, वह हार्डवेयर कोई जीपीयू, एनपीयू या सीपीयू हो. इस वजह से, आपके ऐप्लिकेशन को हर डिवाइस पर सबसे अच्छी परफ़ॉर्मेंस मिल सकती है.
क्लाइंट-साइड पर चलाने के फ़ायदे
पहले से मौजूद एआई के तरीके से, क्लाइंट-साइड पर एआई टास्क करना आसान हो जाता है. इससे ये फ़ायदे मिलते हैं:
- संवेदनशील डेटा की स्थानीय प्रोसेसिंग: क्लाइंट-साइड एआई की मदद से, उपयोगकर्ता की निजता को बेहतर बनाया जा सकता है. उदाहरण के लिए, अगर आपका काम संवेदनशील डेटा से जुड़ा है, तो उपयोगकर्ताओं को एआई की सुविधाएं पूरी तरह सुरक्षित (E2EE) तकनीक के साथ दी जा सकती हैं.
- बेहतर उपयोगकर्ता अनुभव: कुछ मामलों में, सर्वर से रीडायरेक्ट होने की प्रक्रिया को हटाने का मतलब है कि आपको तुरंत नतीजे मिल सकते हैं. क्लाइंट-साइड एआई की मदद से, उपयोगकर्ताओं को बेहतर अनुभव दिया जा सकता है.
- एआई का ज़्यादा ऐक्सेस: आपके उपयोगकर्ताओं के डिवाइसों पर, प्रोसेसिंग का कुछ लोड लिया जा सकता है. इसके बदले, उन्हें सुविधाओं का ज़्यादा ऐक्सेस मिल सकता है. उदाहरण के लिए, अगर आपने एआई की प्रीमियम सुविधाएं ऑफ़र की हैं, तो क्लाइंट-साइड एआई की मदद से इन सुविधाओं की झलक दिखाई जा सकती है. इससे संभावित ग्राहक, आपके प्रॉडक्ट के फ़ायदे देख पाएंगे. इसके लिए, आपको कोई अतिरिक्त शुल्क नहीं देना होगा. इस हाइब्रिड तरीके से, आपको अनुमान लगाने की लागत को मैनेज करने में भी मदद मिल सकती है. खास तौर पर, अक्सर इस्तेमाल किए जाने वाले उपयोगकर्ता फ़्लो पर.
- ऑफ़लाइन एआई का इस्तेमाल: आपके उपयोगकर्ता, इंटरनेट कनेक्शन न होने पर भी एआई की सुविधाओं का इस्तेमाल कर सकते हैं. इसका मतलब है कि आपकी साइटें और वेब ऐप्लिकेशन, ऑफ़लाइन या इंटरनेट कनेक्शन में गड़बड़ी होने पर भी उम्मीद के मुताबिक काम कर सकते हैं.
हाइब्रिड एआई: क्लाइंट-साइड और सर्वर-साइड
क्लाइंट-साइड एआई (AI), इस्तेमाल के कई उदाहरणों को मैनेज कर सकता है. हालांकि, कुछ मामलों में सर्वर-साइड की मदद की ज़रूरत होती है.
बड़े मॉडल के लिए, सर्वर-साइड एआई एक बेहतरीन विकल्प है. साथ ही, यह कई तरह के प्लैटफ़ॉर्म और डिवाइसों पर काम कर सकता है.
इन बातों के आधार पर, हाइब्रिड तरीके का इस्तेमाल किया जा सकता है:
- जटिलता: डिवाइस पर मौजूद एआई की मदद से, खास और आसानी से इस्तेमाल किए जा सकने वाले उदाहरणों को आसानी से इस्तेमाल किया जा सकता है. जटिल इस्तेमाल के उदाहरणों के लिए, सर्वर-साइड लागू करने पर विचार करें.
- रिज़िलिएंस: डिफ़ॉल्ट रूप से सर्वर-साइड का इस्तेमाल करें. साथ ही, डिवाइस के ऑफ़लाइन होने या खराब कनेक्शन होने पर, डिवाइस पर मौजूद डेटा का इस्तेमाल करें.
- ग्रेसफ़ुल फ़ॉलबैक: एआई की सुविधा वाले ब्राउज़र को अपनाने में समय लगेगा. ऐसा हो सकता है कि कुछ मॉडल उपलब्ध न हों. साथ ही, हो सकता है कि पुराने या कम क्षमता वाले डिवाइस, सभी मॉडल को बेहतर तरीके से चलाने के लिए हार्डवेयर की ज़रूरी शर्तों को पूरा न कर पाएं. उन उपयोगकर्ताओं के लिए, सर्वर-साइड एआई की सुविधा उपलब्ध कराएं.
Gemini मॉडल के लिए, Python, Go, Node.js या REST के साथ बैकएंड इंटिग्रेशन का इस्तेमाल किया जा सकता है. इसके अलावा, वेब के लिए Google एआई क्लाइंट SDK टूल की मदद से, अपने वेब ऐप्लिकेशन में इसे लागू किया जा सकता है.
ब्राउज़र का आर्किटेक्चर और एपीआई
Chrome में पहले से मौजूद एआई की सुविधा को बेहतर बनाने के लिए, हमने डिवाइस पर एआई का इस्तेमाल करने के लिए, बुनियादी और विशेषज्ञ मॉडल को ऐक्सेस करने का इंफ़्रास्ट्रक्चर बनाया है. इस इन्फ़्रास्ट्रक्चर की मदद से, ब्राउज़र में पहले से ही कई नई सुविधाएं काम कर रही हैं. जैसे, लिखने में मेरी मदद करो.
पहले से मौजूद एआई की सुविधाओं को मुख्य रूप से टास्क एपीआई की मदद से ऐक्सेस किया जा सकता है. जैसे, Translator API या Summarizer API. टास्क एपीआई को इस तरह डिज़ाइन किया गया है कि वे असाइनमेंट के लिए सबसे अच्छे मॉडल के आधार पर अनुमान लगा सकें.
Chrome में, इन एपीआई को बेहतर बनाने या विशेषज्ञ मॉडल की मदद से, Gemini Nano के आधार पर अनुमान लगाने के लिए बनाया गया है. Gemini Nano को ज़्यादातर आधुनिक डिवाइसों पर स्थानीय तौर पर चलाने के लिए डिज़ाइन किया गया है. यह भाषा से जुड़े इस्तेमाल के उदाहरणों के लिए सबसे अच्छा है. जैसे, खास जानकारी देना, फिर से लिखना या कैटगरी में बांटना.
हम एक्सप्लोरेशन एपीआई भी उपलब्ध करा रहे हैं. जैसे, Prompt API, ताकि आप स्थानीय तौर पर प्रयोग कर सकें और इस्तेमाल के अन्य उदाहरण शेयर कर सकें.
आने वाले समय में, हम एक्सप्लोरेटिव LoRA एपीआई उपलब्ध करा सकते हैं. इससे मॉडल के वेट में बदलाव करके, पहले से मौजूद मॉडल की परफ़ॉर्मेंस को बेहतर बनाया जा सकता है.
पहले से मौजूद एआई का इस्तेमाल कब करना चाहिए
यहां कुछ तरीके दिए गए हैं जिनसे एआई की मदद से, आपको और आपके उपयोगकर्ताओं को फ़ायदा मिल सकता है:
- एआई की मदद से कॉन्टेंट को बेहतर तरीके से समझना: इसमें कॉन्टेंट की खास जानकारी देना, उसका अनुवाद करना, उसे कैटगरी में बांटना, और उसके बारे में जानकारी देना शामिल है.
- एआई की मदद से कॉन्टेंट बनाना: जैसे, लिखने में मदद करना, प्रूफ़रीड करना, व्याकरण में सुधार करना, और वाक्यों को फिर से लिखना.
आगे क्या करना है
पहले से मौजूद कई एआई एपीआई, ऑरिजिन ट्रायल में टेस्ट करने के लिए उपलब्ध हैं. एक्सप्लोरेटरी एपीआई और शुरुआती स्टेज में मौजूद अन्य एपीआई, रिलीज़ होने से पहले झलक देखने की सुविधा वाले प्रोग्राम में हिस्सा लेने वाले लोगों के लिए उपलब्ध हैं.
Google के एआई के JavaScript SDK टूल के लिए, तुरंत शुरू करने की सुविधा में जाकर, अपनी वेबसाइटों और वेब ऐप्लिकेशन के साथ Google के सर्वर पर Gemini Pro का इस्तेमाल करने का तरीका जानें.