पब्लिश किया गया: 18 मई, 2026
WebMCP वेब के लिए एक ऐसा स्टैंडर्ड है जिसे लागू करने का सुझाव दिया गया है. इसकी मदद से, एआई एजेंट के लिए स्ट्रक्चर्ड टूल बनाए और दिखाए जा सकते हैं. WebMCP, JavaScript उपलब्ध कराता है और एचटीएमएल फ़ॉर्म एलिमेंट को एनोटेट करता है. इससे एजेंट को यह पता चलता है कि पेज की सुविधाओं के साथ कैसे इंटरैक्ट करना है, ताकि उपयोगकर्ता को बेहतर अनुभव मिल सके. इससे, एजेंट के काम करने की परफ़ॉर्मेंस और भरोसेमंदता में काफ़ी सुधार हो सकता है.
एआई एजेंट, एक नई टेक्नोलॉजी है. ये उपयोगकर्ताओं को मुश्किल और तकनीकी टास्क बेहतर तरीके से पूरे करने में मदद कर सकते हैं. WebMCP की मदद से, एजेंट के टास्क पूरे करने की सटीक दर ज़्यादा होती है. इसे प्रोग्रेसिव एनहांसमेंट के तौर पर जोड़ा जा सकता है.
WebMCP क्यों इस्तेमाल करें?
WebMCP, वेब ऐप्लिकेशन और एजेंट के बीच के अंतर को कम करने में आपकी मदद कर सकता है. साथ ही, इंटरैक्शन के लिए नियम उपलब्ध कराकर, यह दक्षता, भरोसेमंदता, और टास्क पूरे करने की दर को बेहतर बना सकता है. किसी बटन या फ़ील्ड जैसे एलिमेंट के मकसद को समझने के लिए, एजेंट उसकी समीक्षा करने के बजाय, वेबसाइट एलिमेंट का मकसद बताती है. इससे उसका सही तरीके से इस्तेमाल किया जा सकता है
यह एक्चुएशन से ज़्यादा भरोसेमंद है. एक्चुएशन में कई चरण हो सकते हैं और हर चरण को एजेंट अपनी समझ के हिसाब से पूरा कर सकता है.
वेबसाइटें, टूल तय करके, खोज या खरीदारी जैसे मकसद के बारे में साफ़ तौर पर बता सकती हैं. ये टूल, आपके वेबपेज पर साफ़ तौर पर काम करते हैं. इससे उपयोगकर्ताओं को भरोसा होता है कि टास्क, उम्मीद के मुताबिक पूरे किए जाएंगे. इससे, आपके ब्रैंड और उपयोगकर्ता को ध्यान में रखकर डिज़ाइन किए गए विकल्पों पर कोई असर नहीं पड़ता.
WebMCP इनके साथ काम करता है:
- डिस्कवरी: पेजों के लिए, एजेंट के साथ टूल रजिस्टर करने का एक स्टैंडर्ड तरीका. जैसे,
checkoutयाfilter_results. - JSON स्कीमा: इनपुट और अनुमानित आउटपुट की साफ़ तौर पर दी गई परिभाषाएं. इससे गलत जानकारी या गलतफ़हमी की संभावना कम हो जाती है.
- स्टेट: मौजूदा पेज के कॉन्टेक्स्ट की साझा समझ. इससे एजेंट को यह पता चलता है कि रीयल टाइम में किन संसाधनों पर कार्रवाई की जा सकती है.
हमारा लक्ष्य ऐसे एपीआई बनाना है जिन्हें एजेंट की सुविधाओं वाला कोई भी ब्राउज़र लागू कर सके और उनसे फ़ायदा पा सके. इससे आपके उपयोगकर्ता, टास्क को आसानी से पूरा कर पाएंगे. GitHubपर, इस प्रोसेस के बारे में जानकारी पाई जा सकती है .
इस्तेमाल के उदाहरण
वेब पर WebMCP का इस्तेमाल कई तरीकों से किया जा सकता है. उदाहरण के लिए:
- अपने ग्राहकों को सहायता उपलब्ध कराएं. अगर ग्राहकों को सॉफ़्टवेयर उपलब्ध कराया जाता है, तो अलग-अलग सवालों के जवाब देने के लिए, सहायता का एक मुश्किल फ़्लो हो सकता है. WebMCP का इस्तेमाल करके, एजेंट को सही फ़ॉर्म पर तेज़ी से ले जाया जा सकता है. साथ ही, उपयोगकर्ता की दी गई जानकारी के साथ फ़ील्ड भरे जा सकते हैं.
- यात्रा की बुकिंग को बेहतर बनाएं. एजेंट को कम चरणों में, एक से ज़्यादा शहरों और एक से ज़्यादा यात्रियों के लिए मुश्किल यात्राएं बुक करने में मदद करें.
कुछ कार्रवाइयां संवेदनशील हो सकती हैं, जैसे कि खरीदारी करना. पुष्टि करने वाले डायलॉग के साथ उपयोगकर्ता के इंटरैक्शन का अनुरोध करने के लिए, एक कमांड शामिल की जा सकती है.
असल में, आपके टूल ये टास्क पूरे कर सकते हैं:
- स्ट्रक्चर्ड फ़ॉर्म भरना:
submit_applicationटूल बनाएं. इससे एजेंट को उपयोगकर्ता के साथ बातचीत से इकट्ठा किए गए डेटा को फ़ॉर्म फ़ील्ड में सही तरीके से मैप करने में मदद मिलेगी. उदाहरण के लिए, यह अंतर किया जा सकता है कि किसी फ़ील्ड में पूरा नाम ज़रूरी है या पहला और आखिरी नाम अलग-अलग. - उपयोगकर्ता को ध्यान में रखकर डिज़ाइन किए गए इंटरफ़ेस में एजेंट के इंटरैक्शन की सुविधा देना: कुछ फ़ील्ड,
उपयोगकर्ताओं के लिए डिज़ाइन किए जाते हैं, लेकिन एजेंट उन्हें नहीं समझ पाते.
date_pickटूल बनाया जा सकता है. इससे रिज़र्वेशन या इवेंट बुकिंग में, तारीख और समय को मुश्किल तरीके से चुना जा सकता है. - ऐप्लिकेशन को डीबग करना: डेवलपर सेटिंग वाले पेज पर,
run_diagnosticsटूल बनाया जा सकता है. इससे एजेंट, उन फ़िक्स को ट्रिगर कर सकता है जो नेस्ट किए गए मेन्यू के पीछे छिपे होते हैं.
क्या आपका इस्तेमाल का उदाहरण मौजूद नहीं है? या क्या आपके पास WebMCP के लिए कोई ऐसा आइडिया है जिसे शेयर करने के लिए आप उत्साहित हैं? अर्ली प्रीव्यू प्रोग्राम में शामिल हों और अपने सुझाव या राय शेयर करें.
शुरू करें
WebMCP, स्थानीय डेवलपमेंट के लिए Chrome फ़्लैग के तौर पर उपलब्ध है. यह Chrome के वर्शन 149 में ऑरिजिन ट्रायल में उपलब्ध होगा.
WebMCP को स्थानीय तौर पर चालू करने के लिए:
- Chrome खोलें और
chrome://flags/#enable-webmcp-testingपर जाएं - फ़्लैग को चालू करें पर सेट करें.
- बदलाव लागू करने के लिए, Chrome को फिर से लॉन्च करें.
WebMCP एपीआई का इस्तेमाल करना
अपनी वेबसाइट के टूल सेट अप करने के लिए, दो एपीआई का इस्तेमाल किया जा सकता है:
- इंपेरेटिव एपीआई: स्टैंडर्ड JavaScript की मदद से, अलग-अलग तरह के टूल तय करें. जैसे, फ़ॉर्म इनपुट, नेविगेशन टूल, स्टेट मैनेजमेंट या अन्य फ़ंक्शन.
- डिक्लेरेटिव एपीआई: WebMCP टूल बनाने के लिए, स्टैंडर्ड एचटीएमएल फ़ॉर्म में एनोटेशन जोड़ें.
सीमाएं
WebMCP का मकसद, एजेंट और उपयोगकर्ताओं के लिए मुश्किल टास्क को आसान बनाना है. हालांकि, इसकी कुछ सीमाएं हैं:
- ब्राउज़िंग कॉन्टेक्स्ट ज़रूरी है: टूल कॉल को JavaScript में हैंडल किया जाता है. इसलिए, दिखने वाला इंटरफ़ेस और ब्राउज़र कॉन्टेक्स्ट उपलब्ध कराने के लिए, ब्राउज़र टैब या वेबव्यू खोला जाना चाहिए. दूसरे शब्दों में कहें, तो एजेंट या ऐक्सेसिबिलिटी टूल के लिए, हेडलेस स्टेट में टूल कॉल करने की सुविधा उपलब्ध नहीं है.
- मुश्किल इंटरफ़ेस के लिए ज़्यादा ओवरहेड: अगर आपकी साइट बहुत मुश्किल है, तो आपको ऐप्लिकेशन और इंटरफ़ेस स्टेट को हैंडल करने के लिए, JavaScript को फिर से फ़ैक्टर करने या जोड़ने की ज़रूरत पड़ सकती है.
- टूल की खोज: क्लाइंट और ब्राउज़र को सीधे किसी साइट पर जाकर यह पता करना होगा कि उसमें कॉल किए जा सकने वाले टूल हैं या नहीं.
डेमो
इंपेरेटिव और डिक्लेरेटिव, दोनों तरह के लागू करने के उदाहरण उपलब्ध हैं:
- WebMCP zaMaker, WebMCP इंपेरेटिव एपीआई का इस्तेमाल करता है.
- ट्रैवल डेमो (React), WebMCP इंपेरेटिव एपीआई का इस्तेमाल करता है.
- Le Petit Bistro डेमो, WebMCP डिक्लेरेटिव एपीआई का इस्तेमाल करता है.
इंस्पेक्टर एक्सटेंशन की मदद से, एजेंट के साथ चैट की नकल करना
एजेंट के साथ एक्सपेरिमेंट करने के लिए, Model Context Tool Inspector Extension इंस्टॉल करें. साथ ही, देखें कि लाइव डेमो या आपके अपने ऐप्लिकेशन में, WebMCP टूल कैसे काम करते हैं. यह देखने के लिए कि कोई एजेंट, WebMCP टूल के साथ सही तरीके से इंटरैक्ट कर सकता है या नहीं, नैचुरल लैंग्वेज प्रॉम्प्ट डाले जा सकते हैं.
एक्सटेंशन की मदद से, ये काम किए जा सकते हैं:
navigator.modelContextएपीआई की निगरानी करके, यह देखा जा सकता है कि किसी पेज पर कौनसे टूल रजिस्टर किए गए हैं.- मैन्युअल तरीके से टूल कॉल किए जा सकते हैं और फ़ंक्शन लागू किए जा सकते हैं.
- यह पुष्टि की जा सकती है कि आपका JSON स्कीमा सही तरीके से तय किया गया है और ब्राउज़र, टूल की उम्मीद के मुताबिक डेटा पार्स कर सकता है.
- अपने टूल से मिले स्ट्रक्चर्ड आउटपुट या गड़बड़ी के मैसेज देखे जा सकते हैं. इससे यह पक्का किया जा सकता है कि वे साफ़ तौर पर लिखे गए हैं और सही तरीके से फ़ॉर्मैट किए गए हैं, ताकि कोई एजेंट उन्हें समझ सके.
नैचुरल लैंग्वेज का इस्तेमाल करके, एजेंट से बात करें. इससे यह देखा जा सकता है कि वह सही WebMCP टूल की पहचान कर सकता है और उन्हें लागू कर सकता है या नहीं. आपके प्रॉम्प्ट, gemini-2.5-flash मॉडल को भेजे जाते हैं.
सुझाव या राय देना और बातचीत में शामिल होना
WebMCP पर फ़िलहाल चर्चा चल रही है. आने वाले समय में, इसमें बदलाव हो सकता है. अगर आपने इन एपीआई को आज़माया है और आपके पास कोई सुझाव या राय है, तो हमें इसके बारे में बताएं.
- WebMCP के बारे में जानकारी देने वाला लेख पढ़ें, सवाल पूछें, और चर्चा में शामिल हों.
- WebMCP इस्तेमाल करने के सबसे सही तरीके पढ़ें.
- Chrome Status पर, Chrome के लिए लागू करने की प्रोसेस की समीक्षा करें.
- नए एपीआई को सबसे पहले देखने और हमारी मेलिंग सूची का ऐक्सेस पाने के लिए, अर्ली प्रीव्यू प्रोग्राम में शामिल हों.
- अगर आपके पास Chrome के लागू करने की प्रोसेस के बारे में कोई सुझाव या राय है, तो Chromium में गड़बड़ी की शिकायत करें.