ייחוד כתובות באתרי האינטרנט שמאוחסנים על שרתי לינוקס

לכל העוסקים בקידום במנועי חיפוש ידוע כי כפילות תוכן באתר יכולה לגרום לבעיות רבות במהלך הקידום ובכדי לפתור בעיה זו כבר תקופה ארוכה למדנו להשתמש בתג CANONICAL , אשר נועד לפתור בעיית כפילות תכנים באתרים.

הבעיה שתג זה לא מסוגל לטפל בכל סוגי בעיות של כפילות תכנים ובעיקר בבעיה, כאשר דף הבית של אתר כלשהו זמין בארבע כתובות שונות, לדוגמא:

www.yourdomain.com

yourdomain.com

www.yourdomain.com/index.php

yourdomain.com/index.php

בארבע דוגמאות הנ"ל תוכן זהה יופיע לעיניי גולשי האתר וזה בוודאות יגרום לביות הדירוג במנועי חיפוש.

אז מה ניתן לעשות במקרה מסוג זה ?

האמת, הפתרון של הסוגיה די פשוט ובדוגמא שתוצג כאן, נראה אין במספר שורות קוד פשוטות נגרום לאחידות.

לטובת הפתרון ננצל תמיכה של מערכת הפעלה לינוקס בקבצי HTACCESS

למעשה מדובר על קובץ להגדרת התנהגות האתר, שבספריית השורש שלו ממוקם הקובץ.

והנה הקוד שיבצע את העבודה בצורה נאמנה ויסודית:

# Force all URLs to begin with ‘www’

RewriteCond %{HTTP_HOST} ^yourdomain.com [NC]

RewriteRule ^(.*)$ http://www.yourdomain.com/$1 [L,R=301]

# Redirect any requests to index.php to /

RewriteCond %{THE_REQUEST} ^.*/index.php

RewriteRule ^(.*)index.php$ http://www.yourdomain.com/$1 [R=301,L]

הבלוק הראשון מטפל בתחילית WWW ובעצם אומר שבמידה והוקלדה כתובת ללא WWW אז הסקריפט ישלים את החסר תוך הפעלת הפניית 301 לכתובת המלאה.

הבלוק השני מגדיר התנהגות במידה ולאחר הדומיין הוקלד גם הדף index.php

במידה וזה קורה, הסקריפט יופעל תוך הסרת שם הדף index.php מכתובת דף הבית תוך הפעלת הפניית 301 אל הדומיין הראשי.

בצורה כזו אנו מטפלים בכל ארבע כתובות ומביאים למצב שלא משנה איזו מארבע הכתובות הוקלדה, כל מנוע חיפוש יכיר אך ורק כתובת אחת והיא www.yourdomain.com

יש לציין שקובץ זה יש לשמור כקובץ טקסט בשם .HTACCESS

ממליץ לעיין בשרותים שאני מציע:

קידום אתרים במנועי חיפוש
פרסום ממומן בגוגל
פרסום ממומן בפייסבוק
שיווק אתרים באינטרנט
בניית אתרים מבוססים מערכת לניהול תכנים

בכבוד רב,
לאוניד אוסטרובסקי

 

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *