קידום אתרים » בלוג » הדליפה הגדולה של גוגל – מה אנחנו יכולים ללמוד ממנה?
הדליפה הגדולה של גוגל – מה אנחנו יכולים ללמוד ממנה?
בסוף חודש מאי 24 עולם ה-SEO חווה את אחד האירועים הכי מטלטלים בעשור האחרון: דליפה אמיתית של חלקים מהאלגוריתם של גוגל. הדליפה אושרה על ידי גוגל עצמה, ולמעט מסמכים פנימיים של גוגל שהוצגו לקונגרס האמריקאי ב-2020, זו הפעם הראשונה בה הציבור הרחב נחשף למידע שכזה.
בלי להיכנס ליותר מדי הסברים טכניים, לא מדובר בפריצה לגוגל או משהו כזה, אלא פונקציות שלמתכנתים יש גישה אליהן (API) שנפתחו בטעות לצפייה חופשית באתר GitHub המשמש מתכנתים מכל העולם (בדרך כלל הגישה אליהן מוגבלת למתכנתים מגוגל בלבד).
התפקיד של הפונקציות האלו הוא לשמש כמעין ספר הדרכה למה שניתן לעשות עם האלגוריתם של גוגל ולכל אחת מהן יש הערה אחת או יותר שמסבירה מה היא עושה באנגלית פשוטה במטרה שהמתכנתים יבינו מה היא עושה…
הקוד היה זמין מסוף חודש מרץ עד תחילת חודש מאי, והזמן הזה הספיק בשביל שרשרת של ידיים לשלוף אותו ולהעביר אותו ביניהן (לא ידוע מי היה המדליף המקורי).
בין היתר הם הגיעו גם לבחור בשם ארפן אזימין שהעביר אותו הלאה לרנד פישקין.
למי שלא מכיר, רנד פישקין הוא אחד האנשים הידועים ביותר בסצנת ה-SEO העולמית והמייסד של MOZ, וזאת למרות שהוא כבר לא עוסק באופן פרקטי ב-SEO כבר שש שנים.
לפישקין יש אומנם היסטוריה של עימותים ציבוריים מול גוגל, אבל מרגע שהוא פרסם זאת, היה אפשר לדעת שהדליפה היא באופן כמעט וודאי אמיתית, במיוחד לאחר שהוא אימת את המבנה הכללי של הפונקציות עם אנשים שעבדו לשעבר בגוגל.
האם הדליפה באמת אומרת לנו איך האלגוריתם של גוגל עובד?
קליקים על תוצאות בגוגל
נושא מאוד שנוי במחלוקת הוא השפעת לחיצות של גולשים על התוצאות האורגניות בגוגל (PPC הוא סיפור אחר).
המעניין הוא שרואים התייחסות לדברים כמו “קליקים טובים”, “קליקים רעים” וגם “קליקים אחרונים” וגם “קליקים ארוכים” (יכול להיות שהכוונה היא זמן בעמוד עד חזרה לגוגל). כמו כן יש שיטות למניעת ניצול של המערכת לרעה.
מה שברור הוא שלא כל הקליקים נספרים, ההשפעה שלהם יכולה לרדת או לעלות עם הזמן וחלקם מסוננים החוצה…
מעבר לכך, יש רמז שגוגל מסתמכת על קליקים מתוך סשנים של גלישה מכרום (עוד עניין שהיא הכחישה נמרצות) כדי לבחור אילו כתובות באתר יופיעו כקישורים מתחת לכתובת הראשית כשהוא מופיע ראשון, מה שידוע גם כ-Sitelinks.
בפוסט של קינג הוא מדבר גם על השפעה על “ציון האיכות הכללי” של האתר, כך שייתכן שההשפעה של כרום היא אפילו יותר גבוהה.
על פי המדליף המקורי, גוגל מחברת בין הלחיצות האלו לבין בדיקה ומינוף קישורים מאתרים אחרים. כלומר, הוא יכול להחליט שאם הלחיצות מראות על דף באיכות נמוכה (“יש גם “בינונית ו”גבוהה”), כל הקישורים אליו לא יספרו.
מערכת NavBoost
ואם זה לא מספיק משכנע, יש לכך גם חיזוק נוסף בעדות של גוגל בפני הקונגרס. בעדות עד מטעם גוגל דיבר במפורש על מערכת בשם NavBoost שמבצעת ניתוח של קליקים כבר מ-2005 על סמך נתונים היסטוריים של לפחות שנה אחורה!
NavBoost מוזכרת בקוד לא פחות מ-84 פעמים…
כל הפקטורים האחרים משתייכים למערכת נפרדת בשם Glue, מה שדווקא עשוי להראות על החשיבות של NavBoost שקוטלגה בנפרד.
רשימות לבנות של נושאים שנויים במחלוקת
הפידבק מהבודקים האנושיים מופיע באלגוריתם
גוגל לא מכחישה את העובדה שהיא משתמשת בבודקים אנושיים כדי לעבור על תוצאות חיפוש ולשפר את האלגוריתם שלה, אבל מכאן ועד לשימוש בפידבק הזה ישירות באלגוריתם יש דרך ארוכה.
הפונקציה באלגוריתם מדברת באופן ברור על “טווח טוב” לעומת “טווח רע”, האם המדרג יכול להבין את הנושא שבאתר ועוד…
מכיוון שלא הגיוני שהאלגוריתם מסתמך על חיפושים ספציפיים (יש אינסוף כאלו וחלקם הגדול לא בוצעו קודם), ההשערה של ראנד היא שמדובר במודל למידה ולא בדירוג ישיר שממנו האלגוריתם לומד.
הסיכום של פישקין
בסוף הפוסט שלו, פישקין נותן עוד כמה פרשנויות מעניינות:
1.גוגל עדיין נותן יותר קרדיט לברנדים ורק לאחר מכן לאתרים עצמאיים, וברנד יכול להיחשב שכזה גם על סמך נכסים אחרים שיש לו באינטרנט כמו למשל פרופילים חברתיים. אם פעם היה אפשר להביא אתר לא מוכר למקומות גבוהים על ידי שימוש בהמון טכניקות מוכרות, היום גוגל נותן עדיפות ברורה לאתרים שאנשים כבר רגילים להשתמש בהם.
לכן יותר מכל דבר אחר, חשוב גם למתג את האתר בעיני הגולשים עד כמה שאפשר.
2.אין התייחסות רבה ל-E-E-A-T ולכן יכול להיות שמדובר בסוג של פרופגנדה של גוגל עצמה שרוצה לגרום לאתרים לנסות ולהיות אמינים יותר (ראו גם את קינג על YMYL).
3.ייתכן מאוד שהאופן בו הגולשים מתקשרים עם האתר בתוצאות החיפוש חשוב יותר לא רק מקישורים, אלא גם מהתוכן עצמו!
4.כותרת העמוד (Title) היא עדיין מאוד חשובה ולעומת זאת טקסט קישור או התאמה של טקסט (בתוך גוף המסמך כנראה…) הרבה פחות. גם ה-PageRank אומנם מוזכר בכמה מקומות, אבל נראה שהמשמעות שלו השתנתה במשך השנים.
5.ואולי הכי חשוב, קחו את מה שאחרים כותבים על גוגל בעירבון מוגבל. פישקין אומר שאתרים שמתייחסים למה שגוגל אומרת כעובדות ומבליטים אותן בכותרות שלהם עושים יותר נזק מתועלת.
במקום זאת הם (ואתם) צריכים להבין שמדובר רק בטענות שמשמשות את גוגל לטובתה.
תוספות והערות של קינג (iPullRank)
"ארגז החול של גוגל" עשוי להיות קיים
פנדה הוא למעשה לא עדכון תוכן...
הורדות דירוג על פי פקטורים ספציפיים
גוגל הזהירו בעבר שבמהלך הזמן פקטורים מסוימים ובמיוחד כאלו שמשמשים לטקטיקות ספאם מאבדים מהחשיבות שלהם עם הזמן. הקוד מזכיר באופן ברור כמה דברים כאלו:
- רלוונטיות נושאית – קישור שלא קשור לדף שאליו הוא מפנה יהיה פחות רלוונטי
- הורדת דירוג על פי התוצאות – נראה שמדובר (שוב) במדידה ישירה של הביצועים של אתר בתוך עמודי התוצאות
- ניווט – הכוונה כנראה לחוויית שימוש גרועה באתר (קינג לא מציין איך זה מתבצע, אולי גם כאן אלו סיגנלים מתוך כרום?).
- דומיינים עם מילות מפתח מדויקות הם כבר פחות אפקטיביים – אושר גם על ידי מאט קאטס, ונראה שלשם שינוי הוא אמר אמת…
- סקירות מוצרים – הכוונה כנראה לסקירות שלא נראות אובייקטיביות
- מיקום גאוגרפי – נראה שגוגל מנסה להבין את ההקשר בין האתר לבין המיקום הגאוגרפי שקשור אליו. הפרשנות האישית שלנו היא שאתרים שמנסים לעשות כל מיני דברים כמו דף “קידום אתרים בדרום” גם אם הם בעצם נמצאים ברמת גן לא באמת מרוויחים מזה…
- אתרים בעלי תוכן מיני – אין צורך להוסיף…
לא בטוח שקישורים באמת מאבדים מהחשיבות שלהם
שימוש בדומיין ישן לצורך בניית אתר חדש
גוגל הוציאו עדכון ספציפי ב-2024 שמטרתו להילחם בתופעה הזו של “ניצול דומיינים לרעה”. אבל, מהתיעוד של גוגל רואים באופן ברור שכבר קודם לכן היה מנגנון למניעת “טריקים” כאלו:
ובכן, מסתבר שגוגל מתייחס ל- 20 הגרסאות האחרונות של כל עמוד כשהוא מתבונן על קישורים (ובאופן מפתיע שומר את כולן מהרגע שהוא סורק את העמוד לראשונה), ולכן אין פלא שאם פתאום מקשרים לעמוד חדש באיכות נמוכה או שאין לו קשר לקישור המקורי, התרומה לאתר החדש תהיה אפסית…
Your Money Your Life
"הטמעות" (Embeddings)
המשמעות בעברית היא קצת שונה: גוגל בודקת כאן עד כמה עמוד מסוים קרוב מבחינה נושאית לנושא הכללי של האתר. במילים אחרות, האם הוא Off-Topic או לא. קינג אומנם לא מזכיר את זה, אבל גוגל כבר אמרה לפחות פעם אחת שלא כדאי להתפזר עם האתר שלכם יותר מדי…
ועוד כמה דברים קטנים:
- ה-Pagerank אולי לא נעלם לגמרי – יש עדיין התייחסות ל-Pagerank ברמת האתר למרות שגוגל כבר מזמן לא מציגה אותו (אם כי נראה שהוא עדיין מחושב).
- לגוגל יש כנראה איזשהו מדד Trust בקוד מופיע רפרנס לאמון של כל אתר והאופן בו הוא משפיע על קישורים לאתרים אחרים.
- ייתכן שלגודל הטקסט יש עדיין משמעות – יש עדיין פונקציה שקשורה לגודל הטקסט (כולל טקסט של קישורים) למרות שזו נחשבת לטקטיקת SEO די פרימיטיבית היום.
- קישורים פנימיים – ייתכן שלא כל הקישורים הפנימיים בתוך האתר נספרים.
- לא בטוח שיש משמעות ל-Disavow Tool – אין שום התייחסות לכלי להורדת הערך של קישורים (Disavow Tool) שהיה אמור לעבוד דרך שליחה של קישורים בעייתיים ולעזור לאתרים שנפגעו בעדכוני ספאם שונים… – קינג שואל האם זה עוד טריק של גוגל ללמוד מהפידבק של מנהלי ומקדמי אתרים?
- תוכן קצר יכול להתברג במקומות גבוהים, אבל אין חשיבות למספר התווים – מעבר לעניין ה-Title, מסתבר שיש התייחסות גם לתוכן קצר עם מדד איכות משלו שיכול לנוע בין 1 ל-512, למרות שלא בדיוק ברור איך הוא מחושב.
מנגד, אין חשיבות למספר התווים המדויק, משהו שגוגל כבר טענו בעבר. - תאריכים – תאריך הכתיבה של התוכן או העדכון האחרון שלו חשובים ולכן עדיף שהם יהיו כתובים היכנשהו (אפילו ב-URL)
- ל”אתר ווידאו” יש התייחסות אחרת – אם 50% מהדפים באתר כוללים וידאו, גוגל מתייחס אליו באופן שונה (לא ברור לגמרי כיצד).
- אתרים קטנים – ייתכן שגוגל דווקא נותנת “קידום” לאתרים קטנים, אם כי לא ברור מהי ההגדרה לאתרים שכאלו…
- התייחסות ל”בייבי פנדה” – לא ברור מה זה, האם מדובר במה שגוגל החלה לקרוא לו Helpful Content?
- התייחסות לכותב (Authorship) – עוד משהו שגוגל הכחישה. עכשיו אנחנו יודעים שקיימת פונקציה שבודקת האם מי שחתום על המאמר באמת כתב אותו ומי זה בדיוק.