ส่วนนี้จะอธิบายวิธีที่ CrUX รวบรวมและจัดระเบียบข้อมูลประสบการณ์ของผู้ใช้
การมีสิทธิ์
หัวใจสำคัญของชุดข้อมูล CrUX คือประสบการณ์ของผู้ใช้แต่ละราย ซึ่งจะ รวบรวมเป็นการกระจายระดับหน้าเว็บและระดับต้นทาง ส่วนนี้ จะบันทึกการมีสิทธิ์ของผู้ใช้และข้อกำหนดสำหรับหน้าเว็บและต้นทางที่จะรวมไว้ในชุดข้อมูล ต้องเป็นไปตามเกณฑ์การมีสิทธิ์ทั้งหมดเพื่อให้ระบบรวมประสบการณ์ไว้ในข้อมูลระดับหน้าเว็บที่พร้อมใช้งานใน PageSpeed Insights และ CrUX API: ผู้ใช้ ต้นทาง และหน้าเว็บ ประสบการณ์ที่ตรงตามเกณฑ์ผู้ใช้และต้นทาง แต่ไม่ตรงตามเกณฑ์หน้าเว็บจะไม่รวมอยู่ในข้อมูลระดับต้นทางที่มีอยู่ในแหล่งข้อมูล CrUX ทั้งหมด
ระบบจะรวมหรือนำหน้าเว็บและต้นทางออกจากชุดข้อมูลโดยอัตโนมัติหาก การมีสิทธิ์เปลี่ยนแปลงไปเมื่อเวลาผ่านไป ขณะนี้คุณไม่สามารถส่งหน้าเว็บหรือต้นทางเพื่อรวมไว้ด้วยตนเองได้
ค้นพบได้แบบสาธารณะ
หน้าเว็บต้องค้นพบได้แบบสาธารณะจึงจะได้รับการพิจารณาให้รวมอยู่ในชุดข้อมูล CrUX
ระบบจะพิจารณาว่าหน้าเว็บค้นพบได้แบบสาธารณะโดยใช้เกณฑ์ความสามารถในการจัดทําดัชนีเดียวกันกับเครื่องมือค้นหา
หน้าเว็บไม่เป็นไปตามข้อกำหนดด้านการค้นพบหากเป็นไปตามเงื่อนไขใดเงื่อนไขหนึ่งต่อไปนี้ ซึ่งรวมถึงหน้าหลักของชุดข้อมูลต้นทาง
- หน้าเว็บแสดงด้วยรหัสสถานะ HTTP อื่นที่ไม่ใช่
200(หลังการเปลี่ยนเส้นทาง) - หน้าเว็บแสดงผลด้วย
X-Robots-Tag: noindexส่วนหัว HTTP หรือเทียบเท่า - เอกสารมี
<meta name="robots" content="noindex">แท็ก Meta หรือเทียบเท่า
ดูภาพรวมสถานะการจัดทำดัชนีของเว็บไซต์ได้ใน Google Search Console
ได้รับความนิยมมากพอ
ระบบจะพิจารณาว่าหน้าเว็บได้รับความนิยมเพียงพอหากมีผู้เข้าชมตามจำนวนขั้นต่ำ และจะพิจารณาว่าต้นทางได้รับความนิยมเพียงพอหากมีผู้เข้าชมตามจำนวนขั้นต่ำ ในหน้าเว็บทั้งหมดของต้นทาง เราจะไม่เปิดเผยจำนวนที่แน่นอน แต่ได้เลือกจำนวนดังกล่าวเพื่อให้มั่นใจว่าเรามีตัวอย่างเพียงพอที่จะมั่นใจใน การกระจายทางสถิติของหน้าเว็บที่รวมไว้ จำนวนขั้นต่ำสำหรับหน้าเว็บและต้นทางจะเท่ากัน
หน้าและต้นทางที่ไม่เป็นไปตามเกณฑ์ความนิยมจะไม่รวมอยู่ในชุดข้อมูล CrUX
Origin
ต้นทางแสดงถึง
เว็บไซต์ทั้งหมดที่เข้าถึงได้ด้วย URL เช่น https://www.example.com หากต้องการให้รวมต้นทางไว้ในชุดข้อมูล CrUX ต้นทางนั้นต้องเป็นไปตามข้อกำหนด 2 ข้อต่อไปนี้
คุณยืนยันได้ว่าต้นทางค้นพบได้โดยการเรียกใช้การตรวจสอบ Lighthouse และดูผลลัพธ์หมวดหมู่ SEO เว็บไซต์ของคุณจะค้นพบไม่ได้หากหน้าแรกไม่ผ่านการตรวจสอบหน้าเว็บถูกบล็อกไม่ให้จัดทำดัชนีหรือหน้าเว็บมีรหัสสถานะ HTTP ไม่สำเร็จ
หากพบว่าต้นทางสามารถค้นพบได้แบบสาธารณะ ระบบจะรวบรวมประสบการณ์ของผู้ใช้ที่มีสิทธิ์ในหน้าทั้งหมดของต้นทางนั้นที่ระดับต้นทาง โดยไม่คำนึงถึงความสามารถในการค้นพบของแต่ละหน้า ประสบการณ์ทั้งหมดนี้จะนับรวมในข้อกำหนดด้านความนิยมของต้นทาง
โปรดทราบว่าต้นทางทั้งหมดในชุดข้อมูล CrUX เป็นตัวพิมพ์เล็กเพื่อวัตถุประสงค์ในการค้นหา
หน้า
ข้อกำหนดสำหรับหน้าเว็บที่จะรวมไว้ในชุดข้อมูล CrUX จะเหมือนกับ ต้นทาง
คุณยืนยันได้ว่าหน้าเว็บค้นพบได้โดยการเรียกใช้การตรวจสอบ Lighthouse และดูผลลัพธ์ในหมวดหมู่ SEO หน้าเว็บจะค้นพบไม่ได้หากไม่ผ่านการตรวจสอบ หน้าเว็บถูกบล็อกไม่ให้จัดทำดัชนีหรือ หน้าเว็บมีรหัสสถานะ HTTP ไม่สำเร็จ
หากผู้ใช้บางรายค้นพบหน้าเว็บแบบสาธารณะ แต่หน้าเว็บแสดงสถานะ HTTP ที่ไม่สำเร็จในบางกรณี ระบบจะไม่รวมประสบการณ์เหล่านั้นไว้ใน CrUX
โดยทั่วไปหน้าเว็บจะมีตัวระบุเพิ่มเติมใน URL ซึ่งรวมถึงพารามิเตอร์สตริงคำค้นหา เช่น ?utm_medium=email และ Fragment เช่น #main ระบบจะนำตัวระบุเหล่านี้ออกจาก URL ในชุดข้อมูล CrUX เพื่อให้ระบบรวบรวมประสบการณ์ของผู้ใช้ทั้งหมดในหน้าเว็บไว้ด้วยกัน ซึ่งจะเป็นประโยชน์สำหรับหน้าเว็บที่ไม่เป็นไปตามเกณฑ์ความนิยมหากมี URL ที่แตกต่างกันจำนวนมากสำหรับหน้าเดียวกัน โปรดทราบว่าในบางกรณีที่พบได้ยาก ระบบอาจจัดกลุ่มประสบการณ์ใช้งานสำหรับหน้าเว็บที่แตกต่างกันไว้ด้วยกันโดยไม่คาดคิด เช่น หากพารามิเตอร์ ?productID=101 และ ?productID=102 แสดงถึงหน้าเว็บที่แตกต่างกัน
หน้าเว็บใน CrUX จะวัดตามหน้าเว็บระดับบนสุด หน้าเว็บที่รวมเป็น iframe จะไม่ได้รับการรายงานแยกต่างหากใน CrUX แต่จะมีส่วนช่วยในเมตริกของหน้าเว็บระดับบนสุด ตัวอย่างเช่น หาก https://www.example.com/page.html ฝัง https://www.example.com/frame.html ใน iframe page.html จะแสดงใน CrUX (ขึ้นอยู่กับเกณฑ์การมีสิทธิ์อื่นๆ) แต่ frame.html จะไม่แสดง และหาก frame.html มี CLS ต่ำ ระบบจะรวม CLS เมื่อวัด CLS สำหรับ page.html CrUX คือรายงานประสบการณ์ของผู้ใช้ของ Chrome และผู้ใช้อาจไม่ทราบด้วยซ้ำว่านี่คือ iframe ดังนั้นระบบจะวัดประสบการณ์ในหน้าเว็บระดับบนสุดตามที่ผู้ใช้เห็น
สถาปัตยกรรมของเว็บไซต์อาจทำให้การแสดงข้อมูลใน CrUX มีความซับซ้อน ตัวอย่างเช่น แอปหน้าเว็บเดียว (SPA) อาจใช้รูปแบบการเปลี่ยนเส้นทางที่ใช้ JavaScript เพื่อย้ายไปมาระหว่างหน้าต่างๆ ซึ่งต่างจากการไปยังหน้าเว็บแบบเดิมที่อิงตาม Anchor การเปลี่ยนเหล่านี้จะปรากฏเป็นการดูหน้าเว็บใหม่ต่อผู้ใช้ แต่สำหรับ Chrome และ API ของแพลตฟอร์มพื้นฐาน ประสบการณ์ทั้งหมดจะถือว่าเป็นการดูหน้าเว็บครั้งแรก นี่คือข้อจำกัดของ API ของแพลตฟอร์มเว็บที่ใช้สร้าง CrUX ดูข้อมูลเพิ่มเติมได้ที่สถาปัตยกรรม SPA ส่งผลต่อ Core Web Vitals อย่างไร ใน web.dev
ผู้ใช้
ผู้ใช้ต้องมีคุณสมบัติตรงตามเกณฑ์ต่อไปนี้จึงจะรวบรวมประสบการณ์ของผู้ใช้ไว้ในชุดข้อมูล CrUX ได้
- เปิดใช้การรายงานสถิติการใช้งาน
- ซิงค์ประวัติการเข้าชมของเบราว์เซอร์
- ไม่ได้ตั้งค่าพาสเฟรสการซิงค์
- ใช้แพลตฟอร์มที่รองรับ
แพลตฟอร์มที่รองรับในปัจจุบันมีดังนี้
- Chrome เวอร์ชันเดสก์ท็อป ซึ่งรวมถึงระบบปฏิบัติการ Windows, macOS, ChromeOS และ Linux
- Chrome เวอร์ชัน Android รวมถึงแอปบนอุปกรณ์เคลื่อนที่ที่ใช้แท็บที่กำหนดเองและ WebAPKs
มีข้อยกเว้นที่สำคัญบางอย่างซึ่งไม่ได้ให้ข้อมูลแก่ชุดข้อมูล CrUX ดังนี้
- Chrome ใน iOS
- แอป Android ที่ใช้ WebView
- เบราว์เซอร์ Chromium อื่นๆ (เช่น Microsoft Edge)
Chrome ไม่ได้เผยแพร่ข้อมูลเกี่ยวกับสัดส่วนของผู้ใช้ที่มีคุณสมบัติตรงตามเกณฑ์เหล่านี้ ดูข้อมูลเพิ่มเติมเกี่ยวกับข้อมูลที่เรารวบรวมใน Chrome
Accelerated Mobile Pages (AMP)
หน้าเว็บที่สร้างด้วย AMP จะรวมอยู่ในชุดข้อมูล CrUX เช่นเดียวกับหน้าเว็บอื่นๆ ตั้งแต่การเผยแพร่ CrUX ในเดือนมิถุนายน 2020 เป็นต้นไป ระบบจะบันทึกหน้าเว็บที่แสดงโดยใช้เซิร์ฟเวอร์แคช AMP และ / หรือแสดงในโปรแกรมเปิด AMP และระบุแหล่งที่มาเป็น URL ของหน้าเว็บของผู้เผยแพร่โฆษณาด้วย
คุณภาพของข้อมูล
ข้อมูลใน CrUX จะได้รับการประมวลผลเล็กน้อยเพื่อให้มั่นใจว่าข้อมูลมีความแม่นยำทางสถิติ มีโครงสร้างที่ดี และค้นหาได้ง่ายขึ้น
การกรอง
เรากรองชุดข้อมูล CrUX เพื่อให้มั่นใจว่าข้อมูลที่แสดงนั้นถูกต้องตามสถิติ ซึ่งอาจเป็นการยกเว้นทั้งหน้าเว็บหรือต้นทางไม่ให้ปรากฏในชุดข้อมูล
นอกเหนือจากเกณฑ์การมีสิทธิ์ที่ใช้กับต้นทางและหน้าเว็บแล้ว ยังมีการกรองเพิ่มเติมสำหรับกลุ่มภายในข้อมูลด้วย ดังนี้
ต้นทางหรือหน้าเว็บที่มีการยกเว้นการเข้าชมทั้งหมดมากกว่า 20% เนื่องจากชุดค่าผสมของมิติข้อมูลที่ไม่มีสิทธิ์จะถูกยกเว้นออกจากชุดข้อมูลทั้งหมด
เนื่องจากชุดข้อมูลระดับโลกครอบคลุมประสบการณ์ของผู้ใช้จากทุกประเทศ การผสมมิติข้อมูลที่ไม่เป็นไปตามเกณฑ์ความนิยมที่ระดับประเทศอาจยังรวมอยู่ที่ระดับโลกได้ หากมีความนิยมเพียงพอ
การฟัซ
ระบบจะใช้ความสุ่มเล็กน้อยกับชุดข้อมูลเพื่อป้องกันการวิศวกรรมย้อนกลับของข้อมูลที่ละเอียดอ่อน เช่น ปริมาณการเข้าชมทั้งหมด การดำเนินการนี้จะไม่ส่งผลต่อความแม่นยำของสถิติรวม
ความแม่นยำ
ค่าเมตริกส่วนใหญ่ภายในชุดข้อมูล CrUX จะแสดงเป็นฮิสโทแกรมของ ค่าและขนาดกลุ่ม โดยค่าฮิสโทแกรมคือเศษส่วนของกลุ่มทั้งหมดที่รวมอยู่ ซึ่งรวมกันได้ 1 ขนาดกลุ่มคือตัวเลขทศนิยมระหว่าง 1.0 ถึง 0.0001
ความกว้างของกลุ่มฮิสโทแกรมจะได้รับการปรับให้เป็นมาตรฐานเพื่อลดความซับซ้อนในการค้นหาและแสดงข้อมูล ซึ่งหมายความว่าระบบอาจแบ่งกลุ่มขนาดใหญ่เป็นกลุ่มขนาดเล็ก โดยแต่ละกลุ่มจะมีความหนาแน่นเดิมเท่ากันเพื่อรักษาความกว้างของกลุ่มให้สอดคล้องกัน
ใบอนุญาต
ชุดข้อมูล CrUX โดย Google ได้รับอนุญาตภายใต้สัญญาอนุญาตครีเอทีฟคอมมอนส์สำหรับยอมรับสิทธิของผู้สร้าง (Creative Commons Attribution License) 4.0 แบบสากล