पहले से मौजूद एआई

Kenji Baheux
Kenji Baheux
Alexandra Klepper
Alexandra Klepper

पब्लिश करने की तारीख: 14 मई, 2024, पिछली बार अपडेट करने की तारीख: 16 अक्टूबर, 2024

जब हम वेब पर एआई मॉडल की मदद से सुविधाएं बनाते हैं, तो अक्सर बड़े मॉडल के लिए, सर्वर-साइड के समाधानों का इस्तेमाल किया जाता है. यह बात खास तौर पर जनरेटिव एआई के लिए सही है. यहां सबसे छोटे मॉडल भी वेब पेज के औसत साइज़ से करीब हज़ार गुना बड़े होते हैं. यह एआई के इस्तेमाल के अन्य उदाहरणों के लिए भी सही है. इनमें मॉडल का साइज़, 10 से 100 मेगाबाइट तक हो सकता है. इन मॉडल को सभी वेबसाइटों पर शेयर नहीं किया जाता. इसलिए, हर साइट को पेज लोड होने पर उन्हें डाउनलोड करना पड़ता है. यह डेवलपर और उपयोगकर्ताओं के लिए काम का नहीं है.

हम ऐसे वेब प्लैटफ़ॉर्म एपीआई और ब्राउज़र से जुड़ी सुविधाएं डेवलप कर रहे हैं जिन्हें एआई मॉडल के साथ-साथ, लार्ज लैंग्वेज मॉडल (एलएलएम) को सीधे ब्राउज़र में इंटिग्रेट करने के लिए डिज़ाइन किया गया है. इसमें Gemini Nano भी शामिल है. यह एलएलएम के Gemini का सबसे बेहतर वर्शन है. इसे ज़्यादातर आधुनिक डेस्कटॉप और लैपटॉप कंप्यूटर पर चलने के लिए डिज़ाइन किया गया है. पहले से मौजूद एआई की मदद से, आपकी वेबसाइट या वेब ऐप्लिकेशन, एआई की मदद से काम करने वाले टास्क को पूरा कर सकता है. इसके लिए, उसे अपने एआई मॉडल को डिप्लॉय या मैनेज करने की ज़रूरत नहीं होती.

जानें कि पहले से मौजूद एआई के फ़ायदे क्या हैं, इसे लागू करने का हमारा प्लान क्या है, और इस टेक्नोलॉजी का फ़ायदा कैसे लिया जा सकता है.

रिलीज़ से पहले झलक देखें

एपीआई को बेहतर बनाने के लिए, हमें आपके सुझावों की ज़रूरत है. इससे हमें यह पक्का करने में मदद मिलेगी कि वे आपके इस्तेमाल के उदाहरणों के मुताबिक हों. साथ ही, स्टैंडर्ड बनाने के लिए, अन्य ब्राउज़र वेंडर के साथ हमारी बातचीत में भी मदद मिलेगी.

रिलीज़ होने से पहले सुविधाओं को आज़माने के लिए बने हमारे प्रोग्राम में शामिल हों. इससे, एआई के शुरुआती आइडिया के बारे में सुझाव/राय दी जा सकती है. साथ ही, स्थानीय प्रोटोटाइप के ज़रिए, एपीआई को टेस्ट करने के अवसर भी मिल सकते हैं.

नए एपीआई उपलब्ध होने पर सूचना पाने के लिए, Chrome के एआई डेवलपर के सार्वजनिक एलान वाले ग्रुप में शामिल हों.

वेब डेवलपर के लिए, पहले से मौजूद एआई के फ़ायदे

पहले से मौजूद एआई की मदद से, आपका ब्राउज़र बुनियादी और विशेषज्ञ मॉडल उपलब्ध कराता है और उन्हें मैनेज करता है.

क्लाइंट-साइड एआई बनाने के मुकाबले, पहले से मौजूद एआई के ये फ़ायदे हैं:

  • डिप्लॉयमेंट में आसानी: ब्राउज़र, मॉडल डिस्ट्रिब्यूट करते समय डिवाइस की क्षमता को ध्यान में रखता है और मॉडल के अपडेट मैनेज करता है. इसका मतलब है कि नेटवर्क पर बड़े मॉडल डाउनलोड करने या अपडेट करने की ज़िम्मेदारी आपकी नहीं है. आपको स्टोरेज खाली करने, रनटाइम मेमोरी बजट, सेवा देने की लागत, और अन्य समस्याओं को हल करने की ज़रूरत नहीं है.
  • हार्डवेयर ऐक्सेलरेशन का ऐक्सेस: ब्राउज़र के एआई रनटाइम को ऑप्टिमाइज़ किया गया है, ताकि वह उपलब्ध हार्डवेयर का ज़्यादा से ज़्यादा फ़ायदा ले सके. भले ही, वह हार्डवेयर कोई जीपीयू, एनपीयू या सीपीयू हो. इस वजह से, आपके ऐप्लिकेशन को हर डिवाइस पर सबसे अच्छी परफ़ॉर्मेंस मिल सकती है.

क्लाइंट-साइड चलाने के फ़ायदे

पहले से मौजूद एआई के तरीके की मदद से, क्लाइंट-साइड पर एआई टास्क करना आसान हो जाता है. इससे ये फ़ायदे मिलते हैं:

  • संवेदनशील डेटा की स्थानीय प्रोसेसिंग: क्लाइंट-साइड एआई की मदद से, उपयोगकर्ता की निजता को बेहतर बनाया जा सकता है. उदाहरण के लिए, अगर आपका काम संवेदनशील डेटा से जुड़ा है, तो उपयोगकर्ताओं को एआई की सुविधाएं पूरी तरह सुरक्षित (E2EE) तकनीक के साथ दी जा सकती हैं.
  • उपयोगकर्ता को बेहतर अनुभव देना: कुछ मामलों में, सर्वर पर दोतरफ़ा यात्रा करने का मतलब है कि आपको तुरंत नतीजे मिल सकते हैं. क्लाइंट-साइड एआई की मदद से, उपयोगकर्ताओं को बेहतर अनुभव दिया जा सकता है.
  • एआई का ज़्यादा ऐक्सेस: आपके उपयोगकर्ताओं के डिवाइसों पर, प्रोसेसिंग का कुछ लोड लिया जा सकता है. इसके बदले, उन्हें सुविधाओं का ज़्यादा ऐक्सेस मिल सकता है. उदाहरण के लिए, अगर आपने एआई की प्रीमियम सुविधाएं ऑफ़र की हैं, तो क्लाइंट-साइड एआई की मदद से इन सुविधाओं की झलक देखी जा सकती है. इससे संभावित ग्राहकों को अतिरिक्त शुल्क दिए बिना, आपके प्रॉडक्ट के फ़ायदे दिख सकते हैं. इस हाइब्रिड तरीके से, आपको अनुमान लगाने की लागत को मैनेज करने में भी मदद मिल सकती है. खास तौर पर, अक्सर इस्तेमाल किए जाने वाले उपयोगकर्ता फ़्लो पर.
  • ऑफ़लाइन एआई का इस्तेमाल: आपके उपयोगकर्ता, इंटरनेट कनेक्शन न होने पर भी एआई की सुविधाओं का इस्तेमाल कर सकते हैं. इसका मतलब है कि आपकी साइटें और वेब ऐप्लिकेशन, ऑफ़लाइन या इंटरनेट कनेक्शन में गड़बड़ी होने पर भी उम्मीद के मुताबिक काम कर सकते हैं.

हाइब्रिड एआई: क्लाइंट-साइड और सर्वर-साइड

वैसे तो क्लाइंट-साइड एआई का इस्तेमाल कई तरह के मामलों में किया जा सकता है. हालांकि, कुछ मामलों में सर्वर साइड सपोर्ट की ज़रूरत होती है.

बड़े मॉडल के लिए, सर्वर साइड एआई एक बेहतरीन विकल्प है. यह कई तरह के प्लैटफ़ॉर्म और डिवाइसों के साथ काम कर सकता है.

इन चीज़ों के आधार पर, हाइब्रिड तरीका अपनाया जा सकता है:

  • जटिलता: डिवाइस पर मौजूद एआई की मदद से, खास और आसानी से इस्तेमाल किए जा सकने वाले उदाहरणों को आसानी से इस्तेमाल किया जा सकता है. इस्तेमाल के जटिल उदाहरणों के लिए, सर्वर-साइड लागू करने पर विचार करें.
  • रिज़िलिएंस: डिफ़ॉल्ट रूप से सर्वर-साइड का इस्तेमाल करें. साथ ही, डिवाइस के ऑफ़लाइन होने या खराब कनेक्शन होने पर, डिवाइस पर मौजूद डेटा का इस्तेमाल करें.
  • ग्रेसफ़ुल फ़ॉलबैक: एआई की सुविधा वाले ब्राउज़र को अपनाने में समय लगेगा. ऐसा हो सकता है कि कुछ मॉडल उपलब्ध न हों. साथ ही, हो सकता है कि पुराने या कम क्षमता वाले डिवाइस, सभी मॉडल को बेहतर तरीके से चलाने के लिए हार्डवेयर की ज़रूरी शर्तों को पूरा न कर पाएं. उन उपयोगकर्ताओं के लिए, सर्वर-साइड एआई की सुविधा उपलब्ध कराएं.

Gemini मॉडल के लिए, Python, Go, Node.js या REST के साथ बैकएंड इंटिग्रेशन का इस्तेमाल किया जा सकता है. इसके अलावा, वेब के लिए Google एआई क्लाइंट SDK टूल की मदद से, अपने वेब ऐप्लिकेशन में इसे लागू किया जा सकता है.

ब्राउज़र आर्किटेक्चर और एपीआई

Chrome में पहले से मौजूद एआई के साथ काम करने के लिए, हमने बुनियादी और विशेषज्ञ मॉडल ऐक्सेस करने के लिए इन्फ़्रास्ट्रक्चर बनाया है, ताकि डिवाइस पर ही एक्ज़ीक्यूशन किया जा सके. इस इन्फ़्रास्ट्रक्चर की मदद से, ब्राउज़र की कई नई सुविधाएं पहले से ही काम कर रही हैं. जैसे, लिखने में मेरी मदद करो.

पहले से मौजूद एआई की सुविधाओं को मुख्य रूप से, Task API, जैसे कि Translator API या Summarizer API की मदद से ऐक्सेस किया जा सकता है. टास्क एपीआई को इस तरह डिज़ाइन किया गया है कि वे असाइनमेंट के लिए सबसे अच्छे मॉडल के आधार पर अनुमान लगा सकें.

Chrome में, ये एपीआई इस तरह बनाए गए हैं कि वे फ़ाइन-ट्यून या विशेषज्ञों वाले मॉडल की मदद से, Gemini Nano से अनुमान लगा सकें. Gemini Nano, ज़्यादातर मॉडर्न डिवाइसों पर काम करने के लिए बनाया गया है. Gemini Nano, भाषा से जुड़े कामों के लिए सबसे सही है. जैसे, खास जानकारी देना, अलग-अलग तरीके से जानकारी देना या कैटगरी तय करना.

हम एक्सप्लोरेशन एपीआई भी उपलब्ध करा रहे हैं. जैसे, Prompt API, ताकि आप स्थानीय तौर पर प्रयोग कर सकें और इस्तेमाल के अन्य उदाहरण शेयर कर सकें.

आने वाले समय में, हम एक्सप्लोरेटरी LoRA एपीआई उपलब्ध करा सकते हैं. इससे मॉडल के वेट में बदलाव करके, पहले से मौजूद मॉडल की परफ़ॉर्मेंस को बेहतर बनाया जा सकता है.

इस डायग्राम में बताया गया है कि आपकी वेबसाइट या ऐप्लिकेशन, Chrome में पहले से मौजूद मॉडल ऐक्सेस करने के लिए, टास्क और एक्सप्लोरेट्री वेब प्लैटफ़ॉर्म एपीआई का इस्तेमाल कैसे कर सकता है.

पहले से मौजूद एआई का इस्तेमाल कब करना चाहिए

यहां कुछ तरीके दिए गए हैं जिनसे एआई की मदद से, आपको और आपके उपयोगकर्ताओं को फ़ायदा मिल सकता है:

  • एआई की मदद से कॉन्टेंट का बेहतर तरीके से इस्तेमाल करना: इसमें कॉन्टेंट की खास जानकारी देना, उसका अनुवाद करना, उसे कैटगरी में बांटना, और उसके बारे में जानकारी देना शामिल है.
  • एआई की मदद से कॉन्टेंट बनाना: जैसे, लिखने में मदद करना, प्रूफ़रीड करना, व्याकरण में सुधार करना, और वाक्यों को फिर से लिखना.

आगे क्या करना है

पहले से मौजूद एआई एपीआई आज़माने के लिए, रिलीज़ होने से पहले इस्तेमाल करने का ऐक्सेस देने वाले हमारे कार्यक्रम में शामिल हों.

भाषा की पहचान करने वाले एपीआई को अब ऑरिजिन ट्रायल के तौर पर उपलब्ध कराया गया है, ताकि इसकी और टेस्टिंग की जा सके.

Google के एआई के JavaScript SDK टूल के लिए, तुरंत शुरू करने की सुविधा में जाकर, अपनी वेबसाइटों और वेब ऐप्लिकेशन के साथ Google के सर्वर पर Gemini Pro का इस्तेमाल करने का तरीका जानें.