تشخیص زبان با هوش مصنوعی داخلی

تاریخ انتشار: 24 سپتامبر 2024، آخرین به روز رسانی: 10 دسامبر 2024

قبل از ترجمه متن از یک زبان به زبان دیگر، ابتدا باید تعیین کنید که در متن داده شده از چه زبانی استفاده شده است. پیش از این، ترجمه نیاز به آپلود متن در یک سرویس ابری، انجام ترجمه روی سرور و سپس دانلود نتایج داشت.

زبان شناساگر API از استنتاج در دستگاه استفاده می کند تا بتوانید داستان حریم خصوصی خود را بهبود ببخشید. در حالی که امکان ارسال یک کتابخانه خاص که این کار را انجام می دهد وجود دارد، برای دانلود به منابع بیشتری نیاز دارد.

در دسترس بودن

برای آزمایش اولیه ثبت نام کنید

برای شروع استفاده از Language Detector API، مراحل زیر را دنبال کنید:

  1. خط‌مشی استفاده‌های ممنوعه هوش مصنوعی Google را بپذیرید.
  2. به نسخه آزمایشی اصلی API آشکارساز زبان بروید.
  3. روی ثبت نام کلیک کنید و فرم را پر کنید.
    • در فیلد مبدا وب ، شناسه مبدا یا افزونه خود، chrome-extension://YOUR_EXTENSION_ID ارائه دهید.
  4. برای ارسال، روی ثبت کلیک کنید.
  5. رمز ارائه شده را کپی کنید و آن را به هر صفحه وب در مبدا یا فایل افزونه خود اضافه کنید، که می خواهید آزمایشی روی آن فعال شود.
  6. استفاده از API تشخیص زبان را شروع کنید.

درباره نحوه شروع آزمایشات مبدأ بیشتر بیاموزید.

پشتیبانی را به لوکال هاست اضافه کنید

برای دسترسی به API تشخیص زبان در localhost در طول آزمایش اولیه، باید Chrome را به آخرین نسخه به‌روزرسانی کنید . سپس، این مراحل را دنبال کنید:

  1. به chrome://flags/#language-detection-api بروید.
  2. Enabled را انتخاب کنید.
  3. روی راه اندازی مجدد یا راه اندازی مجدد کروم کلیک کنید.

موارد استفاده نمونه

زبان شناساگر API در درجه اول در سناریوهای زیر مفید است:

  • زبان متن ورودی را تعیین کنید تا بتوان آن را ترجمه کرد.
  • زبان متن ورودی را تعیین کنید تا بتوان مدل صحیح را برای کارهای خاص زبان، مانند تشخیص سمیت، بارگذاری کرد.
  • زبان متن ورودی را تعیین کنید تا بتوان آن را به درستی برچسب گذاری کرد، مثلاً در سایت های شبکه اجتماعی آنلاین.
  • زبان متن ورودی را تعیین کنید تا رابط برنامه را بتوان بر این اساس تنظیم کرد. به عنوان مثال، در یک سایت بلژیکی فقط رابط مربوط به کاربران فرانسوی را نشان می دهد.

از زبان شناساگر API استفاده کنید

زبان شناساگر API بخشی از خانواده بزرگتر API مترجم است. ابتدا شناسایی ویژگی را اجرا کنید تا ببینید آیا مرورگر از API آشکارساز زبان پشتیبانی می کند یا خیر.

if ('ai' in self && 'languageDetector' in self.ai)
  // The Language Detector API is available.
}  

دانلود مدل

تشخیص زبان به مدلی بستگی دارد که برای کار خاص تشخیص زبان ها به خوبی تنظیم شده باشد. در حالی که API در مرورگر ساخته شده است، اولین باری که یک سایت سعی می کند از API استفاده کند، مدل بر اساس تقاضا دانلود می شود. در کروم، این مدل در مقایسه با مدل های دیگر بسیار کوچک است. در واقع، با توجه به اینکه این مدل توسط ویژگی های مرورگر کروم نیز استفاده می شود، ممکن است قبلاً وجود داشته باشد.

برای اینکه ببینید آیا مدل آماده استفاده است، تابع self.ai.languageDetector.capabilities() ناهمزمان را فراخوانی کنید و فیلد available را بررسی کنید. سه پاسخ ممکن وجود دارد:

  • 'no' : مرورگر فعلی از API آشکارساز زبان پشتیبانی می کند، اما در حال حاضر نمی توان از آن استفاده کرد. به عنوان مثال، به دلیل اینکه فضای دیسک آزاد کافی برای دانلود مدل وجود ندارد.
  • 'readily' : مرورگر فعلی از API آشکارساز زبان پشتیبانی می کند و می توان بلافاصله از آن استفاده کرد.
  • 'after-download' : مرورگر فعلی از API آشکارساز زبان پشتیبانی می کند، اما ابتدا باید مدل را دانلود کند.

برای شروع دانلود و نمونه سازی آشکارساز زبان، تابع self.ai.languageDetector.create() ناهمزمان را فراخوانی کنید. اگر پاسخ به capabilities() 'after-download' بود، بهتر است برای پیشرفت دانلود گوش دهید، بنابراین می توانید در صورتی که دانلود زمان بر است به کاربر اطلاع دهید.

برای اینکه ببینید آیا یک زبان مشخص می‌تواند شناسایی شود، تابع languageAvailable() را فراخوانی کنید.

const languageDetectorCapabilities = await self.ai.languageDetector.capabilities();
languageDetectorCapabilities.languageAvailable('es');
// 'readily'

مثال زیر نحوه مقداردهی اولیه آشکارساز زبان را نشان می دهد.

const languageDetectorCapabilities = await self.ai.languageDetector.capabilities();
const canDetect = languageDetectorCapabilities.capabilities;
let detector;
if (canDetect === 'no') {
  // The language detector isn't usable.
  return;
}
if (canDetect === 'readily') {
  // The language detector can immediately be used.
  detector = await self.ai.languageDetector.create();
} else {
  // The language detector can be used after model download.
  detector = await self.ai.languageDetector.create({
    monitor(m) {
      m.addEventListener('downloadprogress', (e) => {
        console.log(`Downloaded ${e.loaded} of ${e.total} bytes.`);
      });
    },
  });
  await detector.ready;
}

ردیاب زبان را اجرا کنید

زبان شناساگر API از یک مدل رتبه بندی استفاده می کند تا مشخص کند کدام زبان به احتمال زیاد در یک قطعه متن مورد استفاده قرار می گیرد. رتبه بندی نوعی یادگیری ماشینی است که هدف آن سفارش دادن لیستی از موارد است. در این مورد، Language Detector API زبان ها را از بالاترین تا کمترین احتمال رتبه بندی می کند.

تابع detect() می‌تواند اولین نتیجه، محتمل‌ترین پاسخ را برگرداند یا بر روی نامزدهای رتبه‌بندی شده با سطح اطمینان تکرار کند. این به‌عنوان فهرستی از اشیاء {detectedLanguage, confidence} برگردانده می‌شود. سطح confidence به صورت مقداری بین 0.0 (کمترین اطمینان) و 1.0 (بالاترین اطمینان) بیان می شود.

const someUserText \= 'Hallo und herzlich willkommen\!';
const results \= await detector.detect(someUserText);
for (const result of results) {
  // Show the full list of potential languages with their likelihood, ranked
  // from most likely to least likely. In practice, one would pick the top
  // language(s) that cross a high enough threshold.
  console.log(result.detectedLanguage, result.confidence);
}
// (Output truncated):
// de 0.9993835687637329
// en 0.00038279531872831285
// nl 0.00010798392031574622
// ...

نسخه ی نمایشی

پیش نمایش زبان شناساگر API در نسخه نمایشی ما. متن نوشته شده به زبان های مختلف را در قسمت متن وارد کنید.

تلاش برای استانداردسازی

پس از اینکه پیشنهاد مربوطه از پشتیبانی کافی برخوردار شد، API آشکارساز زبان به گروه جامعه انکوباتور وب W3C منتقل شد. API بخشی از یک پیشنهاد بزرگتر ترجمه API است.

تیم کروم از گروه معماری فنی W3C بازخورد درخواست کرد و از موزیلا و WebKit برای موقعیت‌های استانداردشان درخواست کرد.

بازخورد خود را به اشتراک بگذارید

اگر بازخوردی در مورد اجرای Chrome دارید، یک اشکال Chromium را ثبت کنید. بازخورد خود را در مورد شکل API زبان API آشکارساز با نظر دادن در مورد یک شماره موجود یا باز کردن یک شماره جدید در مخزن Translation API GitHub به اشتراک بگذارید.

،

تاریخ انتشار: 24 سپتامبر 2024، آخرین به روز رسانی: 10 دسامبر 2024

قبل از ترجمه متن از یک زبان به زبان دیگر، ابتدا باید تعیین کنید که در متن داده شده از چه زبانی استفاده شده است. پیش از این، ترجمه نیاز به آپلود متن در یک سرویس ابری، انجام ترجمه در سرور و سپس دانلود نتایج داشت.

زبان شناساگر API از استنتاج در دستگاه استفاده می کند تا بتوانید داستان حریم خصوصی خود را بهبود ببخشید. در حالی که امکان ارسال یک کتابخانه خاص که این کار را انجام می دهد وجود دارد، برای دانلود به منابع بیشتری نیاز دارد.

در دسترس بودن

برای آزمایش اولیه ثبت نام کنید

برای شروع استفاده از Language Detector API، مراحل زیر را دنبال کنید:

  1. خط‌مشی استفاده‌های ممنوعه هوش مصنوعی Google را بپذیرید.
  2. به نسخه آزمایشی اصلی API آشکارساز زبان بروید.
  3. روی ثبت نام کلیک کنید و فرم را پر کنید.
    • در فیلد مبدا وب ، شناسه مبدا یا افزونه خود، chrome-extension://YOUR_EXTENSION_ID ارائه دهید.
  4. برای ارسال، روی ثبت کلیک کنید.
  5. رمز ارائه شده را کپی کنید و آن را به هر صفحه وب در مبدا یا فایل افزونه خود اضافه کنید، که می خواهید آزمایشی روی آن فعال شود.
  6. استفاده از API تشخیص زبان را شروع کنید.

درباره نحوه شروع آزمایشات مبدأ بیشتر بیاموزید.

پشتیبانی را به لوکال هاست اضافه کنید

برای دسترسی به API تشخیص زبان در localhost در طول آزمایش اولیه، باید Chrome را به آخرین نسخه به‌روزرسانی کنید . سپس، این مراحل را دنبال کنید:

  1. به chrome://flags/#language-detection-api بروید.
  2. Enabled را انتخاب کنید.
  3. روی راه اندازی مجدد یا راه اندازی مجدد کروم کلیک کنید.

موارد استفاده نمونه

زبان شناساگر API در درجه اول در سناریوهای زیر مفید است:

  • زبان متن ورودی را تعیین کنید تا بتوان آن را ترجمه کرد.
  • زبان متن ورودی را تعیین کنید تا بتوان مدل صحیح را برای کارهای خاص زبان، مانند تشخیص سمیت، بارگذاری کرد.
  • زبان متن ورودی را تعیین کنید تا بتوان آن را به درستی برچسب گذاری کرد، مثلاً در سایت های شبکه اجتماعی آنلاین.
  • زبان متن ورودی را تعیین کنید تا رابط برنامه را بتوان بر این اساس تنظیم کرد. به عنوان مثال، در یک سایت بلژیکی فقط رابط مربوط به کاربران فرانسوی را نشان می دهد.

از زبان شناساگر API استفاده کنید

زبان شناساگر API بخشی از خانواده بزرگتر API مترجم است. ابتدا تشخیص ویژگی را اجرا کنید تا ببینید آیا مرورگر از API آشکارساز زبان پشتیبانی می کند یا خیر.

if ('ai' in self && 'languageDetector' in self.ai)
  // The Language Detector API is available.
}  

دانلود مدل

تشخیص زبان به مدلی بستگی دارد که برای کار خاص تشخیص زبان ها به خوبی تنظیم شده باشد. در حالی که API در مرورگر ساخته شده است، اولین باری که یک سایت سعی می کند از API استفاده کند، مدل بر اساس تقاضا دانلود می شود. در کروم، این مدل در مقایسه با مدل های دیگر بسیار کوچک است. در واقع، با توجه به اینکه این مدل توسط ویژگی های مرورگر کروم نیز استفاده می شود، ممکن است قبلاً وجود داشته باشد.

برای اینکه ببینید آیا مدل آماده استفاده است، تابع self.ai.languageDetector.capabilities() ناهمزمان را فراخوانی کنید و فیلد available را بررسی کنید. سه پاسخ ممکن وجود دارد:

  • 'no' : مرورگر فعلی از API آشکارساز زبان پشتیبانی می کند، اما در حال حاضر نمی توان از آن استفاده کرد. به عنوان مثال، به دلیل اینکه فضای دیسک آزاد کافی برای دانلود مدل وجود ندارد.
  • 'readily' : مرورگر فعلی از API آشکارساز زبان پشتیبانی می کند و می توان بلافاصله از آن استفاده کرد.
  • 'after-download' : مرورگر فعلی از API آشکارساز زبان پشتیبانی می کند، اما ابتدا باید مدل را دانلود کند.

برای شروع دانلود و نمونه سازی آشکارساز زبان، تابع self.ai.languageDetector.create() ناهمزمان را فراخوانی کنید. اگر پاسخ به capabilities() 'after-download' بود، بهتر است برای پیشرفت دانلود گوش دهید، بنابراین می توانید در صورتی که دانلود زمان بر است به کاربر اطلاع دهید.

برای اینکه ببینید آیا یک زبان مشخص قابل تشخیص است یا خیر، تابع languageAvailable() را فراخوانی کنید.

const languageDetectorCapabilities = await self.ai.languageDetector.capabilities();
languageDetectorCapabilities.languageAvailable('es');
// 'readily'

مثال زیر نحوه مقداردهی اولیه آشکارساز زبان را نشان می دهد.

const languageDetectorCapabilities = await self.ai.languageDetector.capabilities();
const canDetect = languageDetectorCapabilities.capabilities;
let detector;
if (canDetect === 'no') {
  // The language detector isn't usable.
  return;
}
if (canDetect === 'readily') {
  // The language detector can immediately be used.
  detector = await self.ai.languageDetector.create();
} else {
  // The language detector can be used after model download.
  detector = await self.ai.languageDetector.create({
    monitor(m) {
      m.addEventListener('downloadprogress', (e) => {
        console.log(`Downloaded ${e.loaded} of ${e.total} bytes.`);
      });
    },
  });
  await detector.ready;
}

ردیاب زبان را اجرا کنید

زبان شناساگر API از یک مدل رتبه بندی استفاده می کند تا مشخص کند کدام زبان به احتمال زیاد در یک قطعه متن مورد استفاده قرار می گیرد. رتبه بندی نوعی یادگیری ماشینی است که هدف آن سفارش دادن لیستی از موارد است. در این مورد، Language Detector API زبان ها را از بالاترین تا کمترین احتمال رتبه بندی می کند.

تابع detect() می‌تواند اولین نتیجه، محتمل‌ترین پاسخ را برگرداند یا بر روی نامزدهای رتبه‌بندی شده با سطح اطمینان تکرار کند. این به‌عنوان فهرستی از اشیاء {detectedLanguage, confidence} برگردانده می‌شود. سطح confidence به عنوان مقداری بین 0.0 (کمترین اطمینان) و 1.0 (بالاترین اطمینان) بیان می شود.

const someUserText \= 'Hallo und herzlich willkommen\!';
const results \= await detector.detect(someUserText);
for (const result of results) {
  // Show the full list of potential languages with their likelihood, ranked
  // from most likely to least likely. In practice, one would pick the top
  // language(s) that cross a high enough threshold.
  console.log(result.detectedLanguage, result.confidence);
}
// (Output truncated):
// de 0.9993835687637329
// en 0.00038279531872831285
// nl 0.00010798392031574622
// ...

نسخه ی نمایشی

پیش نمایش زبان شناساگر API در نسخه نمایشی ما. متن نوشته شده به زبان های مختلف را در قسمت متن وارد کنید.

تلاش برای استانداردسازی

پس از اینکه پیشنهاد مربوطه از پشتیبانی کافی برخوردار شد، API آشکارساز زبان به گروه جامعه انکوباتور وب W3C منتقل شد. API بخشی از یک پیشنهاد بزرگتر Translation API است.

تیم کروم از گروه معماری فنی W3C بازخورد درخواست کرد و از موزیلا و WebKit برای موقعیت‌های استانداردشان درخواست کرد.

بازخورد خود را به اشتراک بگذارید

اگر بازخوردی در مورد اجرای Chrome دارید، یک اشکال Chromium را ثبت کنید. بازخورد خود را در مورد شکل API زبان API آشکارساز با نظر دادن در مورد یک شماره موجود یا باز کردن یک شماره جدید در مخزن Translation API GitHub به اشتراک بگذارید.