I/O 2025 এ আমাদের AI আলোচনা দেখুন

অনুসরণ
Alexandra Klepper

প্রকাশিত: ২২ মে, ২০২৫

ওয়েব ডেভেলপাররা ওয়েবসাইট এবং ওয়েব অ্যাপ্লিকেশন তৈরির পদ্ধতিতে AI রূপান্তর ঘটাচ্ছে। Google I/O 2025-এ, আমরা গত বছর ধরে আমরা কী নিয়ে কাজ করছি তা শেয়ার করেছি, আমাদের অংশীদাররা ওয়েবে AI কীভাবে ব্যবহার করছে তা প্রদর্শন করেছি এবং নতুন বিল্ট-ইন AI API ঘোষণা করেছি

তুমি কি অনুষ্ঠানটি মিস করেছো? সুখবর, এখন তুমি অন-ডিমান্ড আলোচনা দেখতে পারো!

ক্রোমে জেমিনি ন্যানো সহ ব্যবহারিক বিল্ট-ইন এআই

আমাদের মূল লক্ষ্য হল সকল ডেভেলপার এবং সকল ব্যবহারকারীর জন্য Chrome এবং ওয়েবকে আরও স্মার্ট করে তোলা। এই আলোচনায়, থমাস স্টেইনার বিল্ট-ইন AI এর আপডেট, ব্যবহারিক ব্যবহারের ক্ষেত্রে এবং আমাদের ভবিষ্যতের দিকে এক নজরে আলোচনা করেছেন।

বিল্ট-ইন এআই ব্রাউজারে ক্লায়েন্ট-সাইড মডেল চালায়, যার বেশ কয়েকটি সুবিধা রয়েছে:

  • ব্যক্তিগত : সংবেদনশীল ব্যবহারকারীর ডেটা ডিভাইসে থেকে যায়, কখনও ব্রাউজার ছেড়ে যাওয়ার প্রয়োজন হয় না।
  • অফলাইন : অ্যাপ্লিকেশনগুলি ইন্টারনেট সংযোগ ছাড়াই AI ক্ষমতা অ্যাক্সেস করতে পারে।
  • পারফর্ম্যান্ট : হার্ডওয়্যার অ্যাক্সিলারেশনের জন্য ধন্যবাদ, এই API গুলি চমৎকার পারফর্ম্যান্স প্রদান করে।

প্রতিটি বিল্ট-ইন AI API- এর কোড নমুনাগুলি একবার দেখুন, তাদের অবস্থা সম্পর্কে আপডেট পান এবং দেখুন কোন কোম্পানিগুলি এই প্রযুক্তিটি বাস্তবায়ন করছে।

মাল্টিমোডাল এপিআই

আমরা একেবারে নতুন মাল্টিমোডাল API নিয়ে কাজ করছি। এর অর্থ হল আপনি জেমিনি ন্যানোকে জিজ্ঞাসা করতে পারেন যে এটি ভিজ্যুয়াল কন্টেন্টে কী "দেখে" বা অডিও কন্টেন্টে "শোনে"। উদাহরণস্বরূপ, ব্লগ প্ল্যাটফর্মে আপলোড করা ছবিতে বিকল্প টেক্সটের জন্য পরামর্শ পান, যা ব্যবহারকারীরা পরিমার্জন এবং পরিবর্তন করতে পারেন। অথবা, আপনি জেমিনি ন্যানোকে পডকাস্টের জন্য বর্ণনা বা ট্রান্সক্রিপশন লিখতে বলতে পারেন।

হাইব্রিড এআই

ক্লায়েন্ট-সাইড এআই নিয়ে ডেভেলপারদের মুখোমুখি হওয়া একটি চ্যালেঞ্জ হল যে সমস্ত প্ল্যাটফর্ম এবং ব্রাউজার ডিভাইসে একটি মডেল চালানোর জন্য হার্ডওয়্যার প্রয়োজনীয়তা পূরণ করে না। জেমিনি এবং ফায়ারবেস ফায়ারবেস ওয়েব SDK তৈরির জন্য অংশীদারিত্ব করেছে যাতে ক্লায়েন্ট-সাইড বাস্তবায়ন অনুপলব্ধ হলে, আপনি সার্ভারে জেমিনি ন্যানোতে ফিরে যেতে পারেন।

তোমার সাথে কাজ করছি

বিল্ট-ইন এআই এপিআই-তে এত ডেভেলপারদের সাথে কাজ করতে পেরে আমরা খুবই আনন্দিত। আপনাদের ছাড়া আমাদের প্রচেষ্টা সম্ভব নয়।

  • প্রারম্ভিক পূর্বরূপ প্রোগ্রাম : ১৬,০০০ এরও বেশি ডেভেলপার EPP তে যোগদান করেছেন, নতুন API পরীক্ষা করছেন, নতুন ব্যবহারের কেস আবিষ্কার করছেন এবং ওয়েবের জন্য আরও ভাল AI তৈরির জন্য প্রতিক্রিয়া প্রদান করছেন।
  • হ্যাকাথন : আমরা দুটি হ্যাকাথন আয়োজন করেছি, এবং আপনি কিছু অসাধারণ ওয়েবসাইট এবং এক্সটেনশন তৈরি করেছেন

তোমার কাজ এখনও শেষ হয়নি। তোমার মতামত জানাতে থাকো, নতুন বিল্ট-ইন API গুলি পরীক্ষা করতে থাকো, এবং আমরা পুনরাবৃত্তি করতে থাকবো। এমনকি তুমি W3C এর ওয়েব মেশিন লার্নিং কমিউনিটি গ্রুপে যোগ দিয়ে এই API গুলিকে মানসম্মত করতে সাহায্য করতে পারো।

আপনার ব্রাউজারে জেমিনি ব্যবহার করে ক্রোম এক্সটেনশনের ভবিষ্যৎ

গত দুই বছরে AI-চালিত এক্সটেনশনের সংখ্যা দ্বিগুণ হয়েছে। প্রকৃতপক্ষে, Chrome ওয়েব স্টোর থেকে ইনস্টল করা সমস্ত এক্সটেনশনের 10% AI ব্যবহার করে। এই আলোচনায়, সেবাস্তিয়ান বেঞ্জ কেন Chrome এক্সটেনশন এবং জেমিনি এত শক্তিশালী সমন্বয়, তার ব্যবহারিক উদাহরণ দিয়েছেন।

উদাহরণগুলির মধ্যে রয়েছে Chrome-এর নতুন চালু হওয়া প্রম্পট API ব্যবহার করে ক্লায়েন্টের ওয়েবসাইটগুলি থেকে ডেটা বের করে এবং প্রক্রিয়াকরণের মাধ্যমে আপনি কীভাবে ব্রাউজারটিকে আরও সহায়ক করে তুলতে পারেন।

ব্যবহারকারীদের কাছে অডিও এবং ছবিগুলিকে আরও অ্যাক্সেসযোগ্য করে তুলতে Chrome এক্সটেনশনগুলিতে Chrome এর প্রম্পটিং API-এর নতুন মাল্টিমোডাল ক্ষমতার সম্ভাবনা প্রদর্শনের উপর।

গুগল ডিপমাইন্ডের প্রজেক্ট মেরিনার কীভাবে ক্রোম এক্সটেনশন এবং সর্বশেষ জেমিনি ক্লাউড এপিআই ব্যবহার করে একটি পূর্ণাঙ্গ ব্রাউজার এজেন্ট তৈরি করে তা ব্যাখ্যা করে ব্রাউজিংয়ের ভবিষ্যত সম্পর্কে এক নজরে দেখার জন্য।

নতুন ব্রাউজিং অভিজ্ঞতা তৈরি করতে এবং ব্রাউজারটিকে আরও সহায়ক করে তুলতে, ক্রোম এক্সটেনশনে ক্লাউডে বা ব্রাউজারে জেমিনি ব্যবহারের সম্ভাবনা অন্বেষণ করুন।

বাস্তব জগতে ওয়েব এআই ব্যবহারের কেস এবং কৌশল

ইউরিকো হিরোটা
Yuriko Hirota
অনুসরণ
Swetha Gopalakrishnan

ইউরিকো হিরোতা এবং স্বেতা গোপালকৃষ্ণান তাদের ব্যবসা এবং ব্যবহারকারীর অভিজ্ঞতা উন্নত করার জন্য ওয়েবে AI ব্যবহার করে এমন কোম্পানিগুলির বাস্তব উদাহরণ তুলে ধরেন। তাদের সমাধান ক্লায়েন্ট-সাইড মডেল, সার্ভার-সাইড, অথবা হাইব্রিড সমাধান ব্যবহার করে কিনা, গুরুত্বপূর্ণ বিষয় হল আপনি আপনার ব্যবহারকারীদের জন্য এখনই যে নতুন নতুন ফাংশন এবং বৈশিষ্ট্যগুলি উপলব্ধ করছেন।

BILIBILI তাদের ভিডিও স্ট্রিমগুলিকে আরও আকর্ষণীয় করে তুলেছে একটি নতুন বৈশিষ্ট্য: বুলেট-স্ক্রিন মন্তব্য । তারা স্পিকারের পিছনে রেন্ডার করা ভিডিওতে রিয়েল-টাইম ব্যবহারকারীর মন্তব্য অফার করে। এটি করার জন্য, তারা ইমেজ সেগমেন্টেশন ব্যবহার করে, যা একটি সুপরিচিত মেশিন লার্নিং ধারণা। ফলস্বরূপ, সেশনের সময়কাল 30% বৃদ্ধি পেয়েছে! টোকোপিডিয়া আপলোড করা ছবির মান মূল্যায়ন করার জন্য একটি মুখ সনাক্তকরণ মডেল ব্যবহার করে তাদের বিক্রেতা যাচাইকরণ প্রক্রিয়ায় ঘর্ষণ কমিয়েছে। ফলস্বরূপ, তারা ম্যানুয়াল অনুমোদন প্রায় 70% কমিয়েছে।

সেরিব্রাল ভিজ্যুয়াল ইম্পেয়ারমেন্ট (CVI) আক্রান্ত শিশুদের জন্য একটি ওয়েব প্ল্যাটফর্ম, ভিশন ন্যানি, AI-চালিত দৃষ্টি উদ্দীপনা কার্যক্রম প্রদান করে। তারা একাধিক মিডিয়াপাইপ লাইব্রেরি ব্যবহার করে, যার মধ্যে হ্যান্ড ল্যান্ডমার্ক সনাক্তকরণ মডেলও রয়েছে, যা একটি ছবি, ভিডিও বা রিয়েল-টাইমে হাতের মূল বিন্দুগুলি সনাক্ত করে। ৫০ জন শিশুর সাথে একজন পাইলট দেখিয়েছেন যে ভিশন ন্যানি ম্যানুয়াল ভিজ্যুয়াল স্টিমুলেশন কার্যক্রমের তুলনায় ৫ গুণ দ্রুত প্রতিক্রিয়া প্রদান করে। থেরাপিস্টরা ম্যানুয়াল সেটআপ অপসারণ করে প্রতি সেশনে গড়ে তিন ঘন্টা সাশ্রয় করার কথা জানিয়েছেন।

গুগল মিটে AI দ্বারা সক্ষম বেশ কিছু বৈশিষ্ট্য রয়েছে, যেমন আলো উন্নত করা থেকে শুরু করে ঝাপসা এবং অস্পষ্ট ভিডিও কমানো। সবচেয়ে বড় চ্যালেঞ্জ হল এই বৈশিষ্ট্যগুলিকে রিয়েল-টাইমে কাজ করতে হবে। এখানেই WebAssembly (Wasm) আসে, কম্পিউটারের CPU-এর পূর্ণ শক্তি ব্যবহার করে রিয়েল-টাইম ভিডিও প্রক্রিয়াকরণ সক্ষম করতে।

এগুলো ওয়েবে AI ব্যবহারের বাস্তব উদাহরণ মাত্র। আরও বেশ কিছু কোম্পানি বিল্ট-ইন AI API গুলি নিয়ে পরীক্ষা-নিরীক্ষা করেছে, যার মধ্যে কিছু কোম্পানি কেস স্টাডিতে তাদের কাজ ভাগ করে নিয়েছে।

ক্লায়েন্ট-সাইড ওয়েব এআই এজেন্টরা ভবিষ্যতের ব্যবহারকারীর অভিজ্ঞতা আরও স্মার্ট করে তুলবে

জেসন মেইস ইন্টারনেটের ভবিষ্যতের দিকে হেঁটেছেন: ওয়েব এআই এজেন্টস। ওয়েবের একটি এজেন্টিক ভবিষ্যত রয়েছে, যা বৃহৎ ভাষা মডেলের (এলএলএম) ক্ষমতার বাইরেও আপনার পক্ষে দরকারী কাজ সম্পাদনের জন্য সরাসরি ব্রাউজারে এআই ক্ষমতা নিয়ে আসে।

ক্লায়েন্ট-সাইড পদ্ধতির মাধ্যমে, গোপনীয়তা বৃদ্ধি, বিলম্ব হ্রাস এবং সম্ভাব্য উল্লেখযোগ্য খরচ সাশ্রয় করা সম্ভব। এজেন্টরা আপনাকে আপনার বিদ্যমান ওয়েবসাইট আপগ্রেড করতে, ব্যবহারকারীর জন্য স্বায়ত্তশাসিতভাবে কাজ সম্পাদন করতে, গতিশীলভাবে উন্মুক্ত সরঞ্জামগুলি নির্বাচন এবং ব্যবহার করতে - সম্ভাব্যভাবে একটি লুপে - এজেন্টকে সম্ভাব্য জটিল বা বহু-পদক্ষেপের কাজগুলি সম্পন্ন করার অনুমতি দেয়।

এজেন্টরা করতে পারেন:

  • উপ-কাজগুলি পরিকল্পনা করুন এবং ভাগ করুন , বহু-পদক্ষেপ পরিকল্পনার মাধ্যমে আরও জটিল সমস্যাগুলি পরিচালনা করুন যাতে কাজটি সম্পূর্ণ করার জন্য যৌক্তিক ধাপে বিভক্ত করা যায়।
  • সেরা টুলগুলি নির্বাচন করুন , তা সে ফাংশন, API ব্যবহার, অথবা অগমেন্টেড ল্যাঙ্গুয়েজ মডেলের বেস জ্ঞানে ডেটাস্টোর অ্যাক্সেস যাই হোক না কেন, তারপর বাইরের জগতে ক্রিয়া সম্পাদন করুন।
  • এজেন্ট বা বহিরাগত সরঞ্জাম থেকে পূর্ববর্তী আউটপুটগুলির উপর ভিত্তি করে প্রসঙ্গ-ভিত্তিক মেমোরি ধরে রাখুন । স্বল্পমেয়াদী মেমোরি মডেলের প্রসঙ্গ উইন্ডো আকার পর্যন্ত প্রসঙ্গ ইতিহাসের একটি FIFO বাফারের মতো কাজ করে, দীর্ঘমেয়াদী মেমোরির বিপরীতে যেখানে একটি ভেক্টর ডাটাবেস পূর্ববর্তী কথোপকথন সেশন বা অন্যান্য ডেটা উৎস থেকে প্রয়োজন অনুসারে তথ্য সংরক্ষণ করতে ব্যবহার করা যেতে পারে।

ওয়েব এআই এজেন্টগুলি জাভাস্ক্রিপ্টে বিদ্যমান ওয়েব প্রযুক্তির সাথে একীভূত করার জন্য ডিজাইন করা হয়েছে। পরিশেষে, ব্রাউজারে সেরা রান মডেলগুলিতে আমাদের হার্ডওয়্যারকে ত্বরান্বিত করা গুরুত্বপূর্ণ। ভবিষ্যতের দিকে তাকালে, WebNN এর মতো প্রযুক্তি CPU, GPU এবং NPU জুড়ে মডেল এক্সিকিউশন অপ্টিমাইজ করার ক্ষেত্রে গুরুত্বপূর্ণ ভূমিকা পালন করবে। ছোট LLM-এর প্রবণতা এবং ক্রমাগত অগ্রগতির সাথে, এটি ভবিষ্যতে আরও শক্তিশালী হয়ে উঠবে।

একটি হাইব্রিড পদ্ধতি ব্যবহার করার কথা বিবেচনা করুন, কৌশলগত ক্লাউড কলের সাথে অন-ডিভাইস প্রক্রিয়াকরণকে একত্রিত করে, যাতে আপনি এখনই ব্রাউজারে বুদ্ধিমান, প্রতিক্রিয়াশীল এবং ব্যক্তিগতকৃত ব্যবহারকারীর অভিজ্ঞতা তৈরি করতে পারেন। শীঘ্রই, ওয়েব এআই পদ্ধতিতে বিনিয়োগ থেকে আপনার লাভ ফলপ্রসূ হবে কারণ ডিভাইসগুলি LLM চালানোর ক্ষেত্রে আরও সক্ষম হয়ে উঠবে।

গুগল আই/ও ২০২৫ দেখুন

আমরা গুগল আই/ও ২০২৫ এর জন্য সমস্ত আলোচনা প্রকাশ করেছি, ওয়েব ডেভেলপারদের জন্য নিবেদিত একটি প্লেলিস্ট সহ। আরও দেখুন io.google/2025 এ।