לכל העוסקים במקצוע קידום במנועי חיפוש ידוע כי כפילות תוכן באתר יכולה לגרום לבעיות רבות במהלך הקידום ובכדי לפתור בעיה זו כבר תקופה ארוכה למדנו להשתמש בתג CANONICAL , אשר נועד לפתור בעיית כפילות תכנים באתרים.
הבעיה שתג זה לא מסוגל לטפל בכל סוגי בעיות של כפילות תכנים ובעיקר בבעיה, כאשר דף הבית של אתר כלשהו זמין בארבע כתובות שונות, לדוגמא:
www.yourdomain.com
yourdomain.com
www.yourdomain.com/index.php
yourdomain.com/index.php
בארבע דוגמאות הנ"ל תוכן זהה יופיע לעיניי גולשי האתר וזה בוודאות יגרום לביות הדירוג במנועי חיפוש.
אז מה ניתן לעשות במקרה מסוג זה ?
האמת, הפתרון של הסוגיה די פשוט ובדוגמא שתוצג כאן, נראה אין במספר שורות קוד פשוטות נגרום לאחידות.
לטובת הפתרון ננצל תמיכה של מערכת הפעלה לינוקס בקבצי HTACCESS
למעשה מדובר על קובץ להגדרת התנהגות האתר, שבספריית השורש שלו ממוקם הקובץ.
והנה הקוד שיבצע את העבודה בצורה נאמנה ויסודית:
# Force all URLs to begin with ‘www’
RewriteCond %{HTTP_HOST} ^yourdomain.com [NC]
RewriteRule ^(.*)$ http://www.yourdomain.com/$1 [L,R=301]
# Redirect any requests to index.php to /
RewriteCond %{THE_REQUEST} ^.*/index.php
RewriteRule ^(.*)index.php$ http://www.yourdomain.com/$1 [R=301,L]
הבלוק הראשון מטפל בתחילית WWW ובעצם אומר שבמידה והוקלדה כתובת ללא WWW אז הסקריפט ישלים את החסר תוך הפעלת הפניית 301 לכתובת המלאה.
הבלוק השני מגדיר התנהגות במידה ולאחר הדומיין הוקלד גם הדף index.php
במידה וזה קורה, הסקריפט יופעל תוך הסרת שם הדף index.php מכתובת דף הבית תוך הפעלת הפניית 301 אל הדומיין הראשי.
בצורה כזו אנו מטפלים בכל ארבע כתובות ומביאים למצב שלא משנה איזו מארבע הכתובות הוקלדה, כל מנוע חיפוש יכיר אך ורק כתובת אחת והיא www.yourdomain.com
יש לציין שקובץ זה יש לשמור כקובץ טקסט בשם .HTACCESS
ממליץ לעיין בשרותים שאני מציע לקידום ופרסום עסקים ברשת:
קידום אתרים במנועי חיפוש
פרסום ממומן בגוגל
פרסום ממומן בפייסבוק
שיווק אתרים באינטרנט
בניית אתרים מבוססים מערכת לניהול תכנים
בכבוד רב,
לאוניד אוסטרובסקי