چگونه گوگل اطلاعات نادرست را تشخیص می دهد؟
چگونه مبارزه گوگل با اطلاعات نادرست؟
هر چند سال یک بار، یک داستان خبری در مورد اینکه چگونه گوگل ظاهراً در کمک به انتشار اطلاعات نادرست و تئوریهای توطئه از طریق ارائه نتایج جستجوی نادرست یا گمراهکننده، همدست است. ما در aisudesign در این مقاله به شما کلیت تشخیص این روند را توضیح میدهیم.
این مکالمه اغلب حول محور قطعههای ویژه متمرکز میشود – کادر متنی که در بالای صفحه نتایج موتور جستجو (SERP) ظاهر میشود تا گوگل پاسخی سریع و بدون کلیک به درخواستهای کاربر ارائه دهد.
در طول سالهای 2016 و 2017، گوگل به دلیل تعدادی از اظهارات نادرست و تحریکآمیز سیاسی که هم در نتایج تکمیل خودکار و هم در قسمتهای ویژه، در مورد دوم از منابع غیرقابل اعتماد و کیفیت پایین بازگردانده شده بودند، مورد انتقاد قرار گرفت. این ادعاها از سرگرم کننده، ناراحت کننده، تا کاملاً با اتهامات سیاسی متفاوت بود.
بدتر از همه، این اسنیپتها حاوی اطلاعات نادرست، گمراهکننده یا تحریکآمیز از سایتهای با کیفیت پایین، سپس برای افرادی که از بلندگوی هوشمند Google Google Home (که اکنون Google Nest نامیده میشود) برای انجام جستجوی صوتی با صدای بلند خوانده میشوند.
پس از اینکه مقیاس اطلاعات نادرست در نتایج ارگانیک برای اولین بار آشکار شد، گوگل بسیار سریع عمل کرد و مکانیسم های بررسی واقعیت و بازخورد کاربر را در صفحات نتایج موتورهای جستجو (SERPs) معرفی کرد. در حالی که گوگل همیشه تلاش کرده است تا اعتبار را در نتایج جستجوی خود در اولویت قرار دهد، این تغییر خاص آغاز نبرد مداوم علیه اطلاعات نادرست و اطلاعات نادرست بود، اگرچه برخی همچنان معتقدند که کافی نیست.
چرا شناسایی اطلاعات نادرست برای گوگل اینقدر سخت است؟
چیزی که بسیاری از گزارشهای مربوط به اطلاعات نادرست در نتایج جستجو به آن توجه نمیکنند، این است که مکانیسم نحوه عملکرد گوگل آن را در برابر انتشار اطلاعات نادرست مانند آتشسوزی آسیبپذیر میکند.
این مکانیکها همان مواردی هستند که به شما کمک میکنند یک لولهکش اضطراری پیدا کنید، یا متوجه شوید که تمرکز حواس چیست، یا یک راهنمای ساختگی برای پختن یک کباب بینظیر پیدا کنید.
هدف گوگل، بر اساس دستورالعملهای ارزیابی کیفیت جستجوی خود (اطلاعات بیشتر در مورد آنها در یک بیت)، «بازگرداندن نتایج مرتبط از معتبرترین منابع موجود» است. بنابراین اقتدار در قلب مأموریت آن بوده و بوده است. با این حال، “ارتباط” و “قابلیت اطمینان” مفاهیم بسیار انسانی هستند که در مورد موتورهای جستجو توسط انسان ها، بلکه توسط الگوریتم ها اندازه گیری می شوند.
یکی از نمونههای آن، PageRank است که اساساً پایه و اساس گوگل است. PageRank به زبان ساده، الگوریتمی است که بر اساس تعداد لینک هایی که از وب سایت های دیگر به آن صفحه اشاره می کنند، تعیین می کند که چقدر احتمال دارد یک صفحه برای کاربران گوگل ارزشمند باشد. اگر بخواهید، این پیام دهان به دهان – یک سیگنال قابل اعتماد انسانی – دیجیتالی است.
Google همچنین سیگنالهای رفتار کاربر را ردیابی میکند – مانند کلیکهای وارد شده به صفحه از یک SERP، میانگین زمانی که کاربر در صفحه صرف میکند و تا چه حد ممکن است به پایین پیمایش کند – تا هم ارتباط و هم قابلیت اطمینان را تعیین کند. همچنین استفاده از مدلهای پردازش زبان طبیعی مبتنی بر هوش مصنوعی مانند BERT و MUM برای درک کیفیت یک محتوا در سطح تقریباً انسانی (مجدداً در مورد آن نوزادان بیشتر خواهد شد) افزایش یافته است.
در تئوری، همه اینها متورم به نظر می رسد. اما پیامدهای منفی برای دقت اطلاعات دارد.
متأسفانه اتکای سنتی گوگل به پیوندها، کلمات کلیدی و سیگنالهای رفتار کاربر به این معنی است که اگر محتوا به خوبی نوشته شده باشد، کاربران با آن درگیر باشند و دامنه دارای تعداد زیادی بک لینک باشد، هیچ چیز مانع از رتبهبندی سایت خبری جعلی نمیشود. خوب یا بد، این یک نقطه کور در مجموعه ای از الگوریتم های بسیار کاربردی است.
چگونه گوگل با انتشار اطلاعات نادرست مبارزه می کند
البته، این بدان معنا نیست که گوگل فقط میتواند به انتقاد درست از کیفیت نتایج جستجوی خود پاسخ دهد: «تقصیر ما نیست، کاربران ما هستند!».
اینجاست که همه چیز از منظر سئو کمی جالب می شود. ببینید، تغییرات در جستجوی Google در خلأ اتفاق نمیافتد. آنها تأثیرات گسترده ای برای همه مشاغلی دارند که سعی می کنند به بالای صفحه نتایج برسند و مهمتر از همه، آنها معمولاً نشان می دهند که Google در کجا تمرکز دارد.
بنابراین، با در نظر گرفتن این موضوع، گوگل برای مبارزه با اطلاعات نادرست چه کرده است، و ما چه چیزی می توانیم از این بیاموزیم؟
راستی آزمایی
اولین تغییر عمده ای که گوگل برای مبارزه با اطلاعات نادرست در نتایج جستجو ایجاد کرد، معرفی ویژگی های بررسی واقعیت بود. اینها عبارتند از Fact Check Explorer که به شدت مورد استفاده قرار نگرفته است ، که بیش از 150000 بررسی واقعیت را از منابعی در سراسر جهان جمعآوری میکند که با دستورالعملهای جستجو، اخبار و نشانهگذاری ساختاری مطابقت دارند.
در طول سالها، گوگل ویژگیهای درون SERP را نیز اضافه کرده است، به ویژه در مورد قطعههای ویژه. اینها عبارتند از «درباره این نتیجه»، که اطلاعاتی را در مورد دامنه ای که اطلاعات قطعه ویژه از آن منبع شده است، و «بازخورد» ارائه می دهد که به کاربران امکان می دهد قطعه های ویژه را به عنوان نادرست یا غیر مفید گزارش کنند.
این بدان معنی است که دریافت یک قطعه ویژه، به ویژه در مورد جستارهای مبتنی بر واقعیت، فقط پاسخ به سؤال نیست، بلکه پاسخ دادن به آن تا حد امکان دقیق است. در غیر این صورت، میتوانید موقعیت مطلوب را به دلیل بررسی دستی کاربران موتورهای جستجو از دست بدهید.

ارزیاب های کیفیت موتور جستجو
در حالی که اکثر گوگل به صورت الگوریتمی کار می کنند، بخشی از نبرد اطلاعات غلط وجود دارد که به طور کامل به صورت دستی انجام می شود. درامرول، لطفاً رتبهدهندگان کیفیت موتور جستجو را معرفی کنید. همینطور این موتور جستجوگر روی کیفیت و مقدار محتوا مناسب حساس می باشد.
Google حدود 10000 ارزیاب کیفیت خارجی دارد که با دستورالعملهای 160 صفحهای ارزشگذار کیفیت جستجو برای ارزیابی مرتبط بودن و قابلیت اطمینان صفحات نتایج مینشینند. تنها در سال 2021، گوگل بیش از 757583 مورد از این تست ها را برای بهبود کیفیت نتایج جستجوی خود برای کاربران انجام داد.
علاوه بر رتبهبندی ارزش اطلاعاتی که با آنها ارائه میشود، از ارزیابهای کیفیت خواسته میشود که تحقیقات معتبری را در مورد منابع انجام دهند تا وبسایتهای غیرقابل اعتمادی را که ممکن است از شبکه خارج شدهاند حذف کنند.
توجه به این نکته بسیار بسیار مهم است که این رتبه بندی ها به هیچ وجه به طور مستقیم بر رتبه بندی نتایج جستجو تأثیر نمی گذارد. هیچ ارزیاب کیفیتی وجود ندارد که به صورت دستی نتیجه شما را به سمت بالا و پایین کردن SERP برای لذت شخصی خود حرکت دهد. رتبهبندیها صرفاً یک نقطه داده هستند که سپس برای اندازهگیری اثربخشی و ایجاد بهبود در الگوریتم به عنوان یک کل استفاده میشوند.
بخور
اول، یک مرور سریع برای افراد ناآشنا. EAT، در اصطلاح موتورهای جستجو، مخفف تخصص، اعتبار و قابل اعتماد بودن است – سه کلمه جادویی که تقریباً در هر بهروزرسانی گوگل در چند سال گذشته ظاهر شدهاند. مانند بسیاری از موارد در سئو، به طرز شگفت انگیزی مبهم است به این معنا که هیچ کس دقیقاً نمی داند چگونه آن را تعریف کند یا دقیقاً چگونه ارزیابی می شود، اما با این وجود یکی از مفاهیم مورد بحث در این حوزه است.
همه اینها به ماموریت اصلی گوگل برای ارائه نتایج مرتبط و قابل اعتماد برمی گردد. اگر میخواهید در مورد علاقهمندی به هنرهای رزمی راهنمایی بخواهید، از دوستتان که واقعاً به بدمینتون علاقه دارد، نپرسیدید؟ شما باید به دنبال کسی باشید که تجربه هنرهای رزمی داشته باشد – متخصصی که بتواند با اقتدار در مورد یک موضوع صحبت کند و به توصیه های او اعتماد کنید.
این چیزی است که گوگل به آن علاقه دارد: شناسایی متخصصان موضوع.
EAT یکی از مهمترین مفاهیم در سئوی مدرن است و در ماموریت آن برای از بین بردن اطلاعات نادرست از طریق یافتن و پاداش دادن به معتبرترین و قابل اعتمادترین منابع در وب، مرکزی است.
نمودار دانش
یکی از مهمترین ابزارهای گوگل برای شناسایی این متخصصان موضوعی گریزان، نمودار دانش و آنچه «موجودات» مینامد است.
به بیانی نابجا، نمودار دانش اساساً یک پایگاه داده به هم پیوسته عظیم از «چیزهایی» است که گوگل قادر به شناسایی آنها است – از جمله افراد، مکانها، محصولات و موضوعات – و مهمتر از همه، نحوه ارتباط همه آنها. گوگل این موارد را “چیزها” نهاد می نامد.
نمودار دانش و تمام نهادهای تشکیل دهنده آن به الگوریتمهای Google اجازه میدهد تا نه فقط بر اساس زبان – مانند کلمات کلیدی – بلکه در مفاهیم و ایدهها فکر کنند.
به این صورت است که می توانید چیزهایی را بدون دانستن نام آنها جستجو کنید.
چرا وقتی صحبت از اطلاعات نادرست می شود این مهم است؟ زیرا از نظر گوگل، افراد (از جمله نویسندگان) نیز موجودیت هستند.
این درک است که منجر به فشار در جامعه SEO برای ایجاد نمایه های نویسنده برای متخصصان موضوع شده است تا EAT فردی آن نویسنده یا “موجود” ایجاد شود. به این ترتیب، گوگل احتمال بیشتری دارد که آنها را به عنوان یک منبع معتبر در یک منطقه خاص بشناسد و امیدواریم صفحات منتسب به آنها را بیشتر در رتبه بندی بالا ببرد.
پردازش زبان طبیعی
به طور قابل توجهی، به عنوان بخشی از به روز رسانی سواد اطلاعاتی خود در 11 آگوست، گوگل همچنین اعلام کرد که مدل یکپارچه چندوظیفه ای مبتنی بر هوش مصنوعی (MUM)، اکنون می تواند مفهوم اجماع را درک کند – که چندین وب سایت در مورد واقعی بودن چیزی به توافق می رسند.
به هر حال، اتکای گوگل به سیگنال هایی مانند بک لینک ها و رفتار کاربر باعث می شود تا حدی اساساً در ارزیابی دقت عینی اطلاعات ناتوان باشد. بنابراین مجبور است راهی برای استفاده از سیگنالهای رتبهبندی موجود برای تعیین احتمال درستی چیزی پیدا کند. دنی سالیوان، رابط عمومی گوگل برای جستجو، از آنها به عنوان “سیگنال های دقت” یاد می کند.
گوگل از نظر تئوری میتواند از پردازش زبان طبیعی و شبکههای عصبی برای ارزیابی EAT و گسترش نمودار دانش استفاده کند. در حالی که عملکرد دقیق درونی الگوریتم های گوگل ناشناخته است، دارای حق امتیازی به نام Generating Author Vectors است . فناوری مربوط به این حق اختراع می تواند تنها بر اساس سبک نوشتن افراد، شناسایی کند، به این معنی که می تواند به صورت الگوریتمی نویسنده متخصص را تعیین کند، حتی زمانی که صفحه منتسب نیست، و به طور بالقوه از این اطلاعات برای بالا بردن استانداردهای کیفیت محتوا برای EAT استفاده کند.
شایان ذکر است که صرفاً داشتن حق ثبت اختراع توسط گوگل به این معنی نیست که این پتنت در حال استفاده است، بلکه این مثال پتانسیل پردازش زبان طبیعی و قابلیت های شبکه عصبی این شرکت را نشان می دهد.




