เผยแพร่: 14 พฤษภาคม 2024 อัปเดตล่าสุด: 20 พฤษภาคม 2024
เรากําลังพัฒนา API ของแพลตฟอร์มเว็บและฟีเจอร์เบราว์เซอร์ที่ออกแบบมาให้ทํางานร่วมกับโมเดล AI, โมเดลผู้เชี่ยวชาญ และโมเดลภาษาขนาดใหญ่ (LLM) ที่สร้างขึ้นในเบราว์เซอร์ ซึ่งรวมถึง Gemini Nano ซึ่งเป็น LLM ตระกูล Gemini เวอร์ชันที่มีประสิทธิภาพมากที่สุด ซึ่งออกแบบมาเพื่อทำงานแบบโลคัลในคอมพิวเตอร์เดสก์ท็อปและแล็ปท็อปที่ทันสมัยที่สุด เมื่อใช้ AI ในตัว เว็บไซต์หรือเว็บแอปพลิเคชันจะทํางานด้วยระบบ AI ได้โดยไม่ต้องติดตั้งใช้งาน จัดการ หรือโฮสต์โมเดล AI ด้วยตนเอง
สำรวจประโยชน์ของ AI ในตัว แผนการติดตั้งใช้งาน และวิธีใช้ประโยชน์จากเทคโนโลยีนี้
ประโยชน์ของ AI ในตัวสําหรับนักพัฒนาเว็บ
เมื่อใช้ AI ในตัว เบราว์เซอร์จะจัดหาและจัดการพื้นฐานและโมเดลผู้เชี่ยวชาญ
AI ในตัวมีข้อดีดังต่อไปนี้
- การติดตั้งใช้งานที่ง่ายดาย: เบราว์เซอร์จะเผยแพร่โมเดลต่างๆ โดยพิจารณาจากความสามารถของอุปกรณ์และจัดการการอัปเดต ซึ่งหมายความว่าคุณไม่มีหน้าที่รับผิดชอบในการดาวน์โหลดหรืออัปเดตโมเดลขนาดใหญ่ผ่านเครือข่าย คุณไม่จําเป็นต้องแก้ปัญหาการลบข้อมูลออกจากพื้นที่เก็บข้อมูล งบประมาณหน่วยความจํารันไทม์ ค่าใช้จ่ายในการแสดง และปัญหาอื่นๆ
- การเข้าถึงการเร่งด้วยฮาร์ดแวร์: รันไทม์ AI ของเบราว์เซอร์ได้รับการเพิ่มประสิทธิภาพเพื่อใช้ฮาร์ดแวร์ที่มีอยู่ให้เกิดประโยชน์สูงสุด ไม่ว่าจะเป็น GPU, NPU หรือใช้ CPU แทน ด้วยเหตุนี้ แอปจึงทำงานได้อย่างมีประสิทธิภาพสูงสุดในแต่ละอุปกรณ์
ประโยชน์ของการเรียกใช้ฝั่งไคลเอ็นต์
AI ในตัวช่วยให้คุณทํางาน AI ฝั่งไคลเอ็นต์ได้ ซึ่งหมายความว่าคุณจะได้รับประโยชน์ต่อไปนี้
- การประมวลผลข้อมูลที่ละเอียดอ่อนในเครื่อง: AI ฝั่งไคลเอ็นต์สามารถปรับปรุงเรื่องราวความเป็นส่วนตัวของคุณได้ เช่น หากคุณทำงานกับข้อมูลที่ละเอียดอ่อน คุณสามารถนำเสนอฟีเจอร์ AI ให้แก่ผู้ใช้ที่มีการเข้ารหัสจากต้นทางถึงปลายทาง
- ประสบการณ์ของผู้ใช้ที่รวดเร็ว: ในบางกรณี การไม่ส่งข้อมูลไปและกลับจากเซิร์ฟเวอร์จะช่วยให้คุณแสดงผลลัพธ์ได้เกือบจะทันที AI ฝั่งไคลเอ็นต์อาจเป็นสิ่งที่ทำให้ฟีเจอร์ใช้งานได้จริงหรือทำให้ประสบการณ์ของผู้ใช้ไม่ดีเท่าที่ควร
- การเข้าถึง AI มากขึ้น: อุปกรณ์ของผู้ใช้สามารถรับภาระการประมวลผลบางส่วนเพื่อแลกกับสิทธิ์เข้าถึงฟีเจอร์มากขึ้น ตัวอย่างเช่น หากคุณเสนอฟีเจอร์ AI พรีเมียม คุณสามารถแสดงตัวอย่างฟีเจอร์เหล่านี้ด้วย AI ฝั่งไคลเอ็นต์เพื่อให้ผู้มีโอกาสเป็นลูกค้าเห็นประโยชน์ของผลิตภัณฑ์ได้ โดยที่คุณไม่มีค่าใช้จ่ายเพิ่มเติม แนวทางแบบผสมผสานนี้ยังช่วยคุณจัดการค่าใช้จ่ายในการอนุมานได้อีกด้วย โดยเฉพาะใน FLow ของผู้ใช้ที่ใช้บ่อย
- การใช้งาน AI ออฟไลน์: ผู้ใช้สามารถเข้าถึงฟีเจอร์ AI ได้แม้ว่าจะไม่มีการเชื่อมต่ออินเทอร์เน็ต ซึ่งหมายความว่าเว็บไซต์และเว็บแอปจะทํางานได้ตามที่คาดไว้แม้ออฟไลน์หรือมีการเชื่อมต่อที่ไม่เสถียร
AI แบบผสม: ฝั่งไคลเอ็นต์และฝั่งเซิร์ฟเวอร์
แม้ว่า AI ฝั่งไคลเอ็นต์จะจัดการ Use Case ได้มากมาย แต่บาง Use Case ก็ต้องใช้การสนับสนุนฝั่งเซิร์ฟเวอร์ AI ฝั่งเซิร์ฟเวอร์เป็นตัวเลือกที่ยอดเยี่ยมสําหรับโมเดลขนาดใหญ่ และรองรับแพลตฟอร์มและอุปกรณ์ที่หลากหลายมากขึ้น
คุณอาจพิจารณาใช้แนวทางแบบผสมผสานหากแอปพลิเคชันของคุณกำหนดให้ต้องดำเนินการต่อไปนี้
- ความซับซ้อน: AI ในอุปกรณ์จะรองรับ Use Case ที่เฉพาะเจาะจงและเข้าถึงได้ง่ายขึ้น สําหรับ Use Case ที่ซับซ้อน ให้พิจารณาการติดตั้งใช้งานฝั่งเซิร์ฟเวอร์
- ความยืดหยุ่น: ใช้ฝั่งเซิร์ฟเวอร์โดยค่าเริ่มต้น และใช้ในอุปกรณ์เมื่ออุปกรณ์ออฟไลน์หรือมีการเชื่อมต่อที่ไม่เสถียร
- การเปลี่ยนโหมดอย่างราบรื่น: การใช้เบราว์เซอร์ที่มี AI ในตัวต้องใช้เวลา อุปกรณ์บางรุ่นอาจไม่พร้อมใช้งาน และอุปกรณ์รุ่นเก่าหรือมีประสิทธิภาพต่ำอาจไม่เป็นไปตามข้อกำหนดด้านฮาร์ดแวร์ในการใช้งานทุกรุ่นอย่างมีประสิทธิภาพสูงสุด เสนอ AI ฝั่งเซิร์ฟเวอร์สำหรับผู้ใช้เหล่านั้น
เช่น หากคุณใช้ Prompt API ในตัว (จะพร้อมใช้งานในเวอร์ชันทดลองของต้นทางในเร็วๆ นี้) API จะใช้งานได้กับเบราว์เซอร์ Chrome ในเดสก์ท็อปและในส่วนขยาย Chrome ใน Windows, macOS และ Linux เท่านั้น ตั้งค่าสถาปัตยกรรมแบบผสมด้วย Firebase AI Logic เพื่อให้ผู้ใช้ทุกคนได้รับประโยชน์จากฟีเจอร์ AI
เมื่อใช้โมเดล Gemini คุณจะสร้างการผสานรวมแบ็กเอนด์ด้วย Node.js ได้
เข้าถึง AI ในตัว
คุณสามารถเข้าถึงความสามารถของ AI ในตัวได้โดยใช้ Task API เป็นหลัก เช่น Translator API หรือ Summarizer API Task API ออกแบบมาเพื่อทำการอนุมานกับโมเดลที่ดีที่สุดสำหรับงาน
ใน Chrome API เหล่านี้สร้างขึ้นเพื่อเรียกใช้การอนุมานกับ Gemini Nano ด้วยการปรับแต่งแบบละเอียดหรือโมเดลผู้เชี่ยวชาญ Gemini Nano ออกแบบมาเพื่อทำงานแบบออฟไลน์ในอุปกรณ์สมัยใหม่ส่วนใหญ่ จึงเหมาะสําหรับกรณีการใช้งานที่เกี่ยวข้องกับภาษา เช่น การสรุป การถอดความใหม่ หรือการจัดหมวดหมู่
กรณีที่ควรใช้ AI ในตัว
ประโยชน์บางส่วนของ AI ในตัวสำหรับคุณและผู้ใช้มีดังนี้
- การบริโภคเนื้อหาที่ปรับปรุงโดย AI: ซึ่งรวมถึงการสรุป การแปล การจัดหมวดหมู่ การสร้างลักษณะ และเป็นแหล่งความรู้
- การสร้างเนื้อหาที่ AI รองรับ เช่น ความช่วยเหลือด้านการเขียน การพิสูจน์อักษร การแก้ไขไวยากรณ์ และการปรับแก้ข้อความ
API AI ในตัวหลายรายการพร้อมใช้งานใน Chrome เวอร์ชันเสถียรและช่วงทดลองใช้จากต้นทาง Exploratory API และ API ระยะเริ่มต้นพร้อมให้บริการแก่ผู้เข้าร่วมโปรแกรมทดลองใช้ก่อนเปิดตัว (EPP)
ดูตัวอย่างฟีเจอร์ใหม่
เราต้องการความคิดเห็นของคุณเพื่อกำหนดรูปแบบ API, ตรวจสอบว่า API เป็นไปตามกรณีการใช้งานของคุณ และใช้เป็นข้อมูลในการพูดคุยกับผู้ให้บริการเบราว์เซอร์รายอื่นๆ เพื่อกำหนดมาตรฐาน
เข้าร่วม EPP เพื่อแสดงความคิดเห็นเกี่ยวกับแนวคิด AI ในตัวในระยะเริ่มต้น และค้นพบโอกาสในการทดสอบ API ที่อยู่ระหว่างการพัฒนาผ่านการสร้างต้นแบบในเครื่อง