תוכן משוכפל? כמה דרכים מהירות להימנע מכך

תוכן משוכפל? כמה דרכים מהירות להימנע מכך

בוודאי שמעתם את הביטוי "תוכן משוכפל" מידי פעם, וכמו כל מנהל אתר השולט בחומר, לא הייתם מעזים באופן מודע לפרסם את אותו התוכן פעמיים - אבל בהחלט יתכן כי, גם ללא ידיעתכם, גם אתם חטאתם בכך.

תוכן משוכפל הינו המקבילה למשיכת יתר בחשבון העובר ושב שלכם, למעט כך, שבמקום לשלם ריבית גבוהה בכל חודש, במקרה של תוכן משוכפל, אתם משלמים ב- Crawl Budget(תקציב הזחילה - המשאבים שמקצה גוגל לסריקת האתר שלכם). תוכן משוכפל עשוי להיות אחת הבעיות החמקמקות ביותר שעלולות להשפיע על יכולת הדירוג של אתרכם, לעתים קרובות, הדבר נובע מארכיטקטורת המידע באתרים או ממגבלות CMS - אשר כנראה מעיד על כך שהשכפול לא התרחש בכוונת זדון.
למרבה הצער, אין בדיקה פשוטה ב-Google Search Console לאתר שכפול מסוג זה. אפילו כלי הצד השלישי המתקדמים ביותר אינם תמיד עושים עבודה טובה במציאת תוכן משוכפל - במיוחד כאשר המקור הוא פנימי.

1. כפילות בין אתרי HTTP לאתרי HTTPS

אחת הדרכים המהירות כדי לבדוק אם לאתרכם יש שתי גרסות אינדוקס חיות הוא ניסיון לבקר באתר באמצעות פרוטוקולי HTTP ו-HTTPS. אם הן קיימות, עדיין אין צורך להיבהל - אלא לוודא כי מפתח האתר מכניס הפניות 301 בגרסת ה-HTTP של האתר. בתקופה בה מינפה גוגל את מהפכת המעבר ל-HTTPS, בוני אתרים רבים בנו רק חלק מהדפים הרלוונטיים באתר בפרוטוקול זה (הדפים שהכילו נתוני גולשים, למשל). עכבישי האנדוקס יצרו שתי גרסאות של האתר וכך נוצר תוכן משוכפל. אותה התופעה קיימת באתרים שלהם גרסת WWW וגרסה ללאWWW בכתובת העמוד.

2. שימוש בקישורים יחסיים (רלטיביים) ולא בקישורים מוחלטים

על מנת לחסוך זמן, חלק ממפתחי האתרים נוהגים להשתמש בקישורים יחסיים ולא בקישורים קבועים (ישירים, מוחלטים) בעת יצירת קישורים פנימיים באתר (לדוגמה - forum/ במקום הקישור הכולל את הנתיב המלא של הדף באתר). במקרה של גניבת תכנים מאתרכם, כאשר משתמשים בכתובות יחסיות, הדפדפן מניח שהקישור מצביע לדף באתר שבו אתם שוהים, וכך, מי שהעתיק את התוכן, זוכה בתעבורה נוספת בתוך האתר שלו. במידה ותרצו לבדוק את ייחודם של התכנים באתרכם, תוכלו לעשות זאת בכלים כ-Siteliner או Copyscape.

3. אתרים ותכנים נשכחים

במידה והחלטתם לעבור לשימוש ב-subdirectory במקום ב-subdomain, או אפילו לבנות אתר חדש לגמרי, אין זה אומר שהתכנים הישנים שלכם נעלמו לגמרי. הם נמצאים אי-שם ועלולים לשוב ולרדוף אתכם כתוכן משוכפל, אם לא תדאגו להפניות 301.

4. סביבת בניה ניסיונית או זמנית

רוב האתרים נעזרים בסביבה ניסיונית לפני פתיחת דלתותיהם לקהל הרחב של הגולשים ומנועי החיפוש. במידה ואינכם מונעים מעכבישי המידע של גוגל לאנדקס אותם, כאשר האתר ה"אמיתי" יעלה לאוויר, התוכן שלו יחשב למשוכפל. הוסיפו noindex לסביבה כולה וטפלו בקובץrobots.txt בהתאם.

5. Subdirectories משוכפלים

במידה והעסק שלכם פועל ביותר ממיקום גיאוגרפי אחד ויש לכם דף נחיתה ראשי אחד, ממנו מתבצע הפיצול לאזורים, משתלם לטרגט הפניה לפי אזור גיאוגרפי ב- Google Search Console, במקום ליצור תיקיות משנה, אשר עלולות לייצר תוכן משוכפל.

6. הפצת תוכן (סינדיקציה)

סינדיקציה היא דרך מצוינת לחשוף את התכנים לקהל חדש, עם זאת, חשוב לקבוע הנחיות למי שרוצה לפרסם את התכנים שלכם. באופן אידיאלי, הייתם יכולים לבקש שהמפרסם ישתמש בתגrel = canonical בדף הכתבה, כדי לציין למנועי חיפוש שהאתר שלכם הוא המקור הראשוני של התוכן. הם יכולים גם לנקוט בשיטת noindex, אשר עשוי לפתור בעיות פוטנציאליות בתוצאות החיפוש, אבל, זה רק בתיאוריה. במציאות, תכנים מועתקים ומשוכפלים ללא תגיות, ובחלק מהמקרים, אפילו ללא קרדיט.


Share on Facebook
Share On LinkedIn
Share by Email