Ідентифікатор сесій (Session Identifer або SID) - це унікальний параметр, який додається до URL сторінки при кожному її відвідуванні користувачем. Має вигляд &session_id= або &c_id=. При розкручуванні сайту використовується для збереження серверної пам'яті, а також для збору статистики про поведінку відвідувача на сайті, що дозволяє проаналізувати і поліпшити юзабіліті ресурсу.
Ідентифікатори сесій не відрізняють користувача від пошукових роботів, останнім також видаються сторінки з унікальним параметром в посиланнях. В результаті боти індексують ці сторінки як самостійні, з власними URL, і в базі з'являється велика кількість однакових документів. Наслідком такої індексації стає склейка сторінок з ідентичним контентом.
Усунення проблем
Щоб ідентифікатори сесій не ускладнювали просування сайту, виконують такі дії.
- Забороняють пошуковим роботам індексувати сторінки з SID при першому заході. Для цього в файл .htaccess додають такі рядки:
- php_flag session.use_trans_sid Off
(Відключення передачі ідентифікатора через додавання його до URL) - php_flag session.use_only_cookie On
(Вказівка сервера передавати ідентифікатори через cookie) - php_flag session.auto_start On
- Реалізують перенаправлення (за допомогою редиректу 301) відвідувачів, що приходять на сайт за адресою з ідентифікатором сесій на сторінки без нього.
- Видаляють список вже проіндексованих роботами сторінок. Даний метод може знизити ефективність пошукової оптимізації сайту, так як після 1-2 апдейтів в індексі не залишиться сторінок з ідентифікаторами сесій.
- Використовують інструменти Яндекс і Google для контролю індексації сторінок з SID.
Яндекс. Директива Clean-param дозволяє описати адреси сторінок сайту з динамікою, які не змінюють їх вміст. Робот, виконуючи вказівки, які не буде багаторазово індексувати дублює інформацію, що знизить навантаження на сервер і збільшить результативність обходу ресурсу. Синтаксис директиви виглядає таким чином:
- Clean-param: p0[&p1&..&pn] [path], де через параметр «&» в першому полі перераховуються не враховуються параметри, а в другому - позначається префікс шляху сторінок, до яких застосовується правило.
Google. Для вказівки правил роботам даної пошукової системи потрібен обліковий запис в Google інструментах для веб-майстра, а сайт повинен бути доданий в консоль цього сервісу. Для початку роботи необхідно зайти в розділ «Конфігурація сайту - Налаштування - Обробка параметрів», задати динамічні параметри, які роботи будуть ігнорувати, і зберегти зміни. В результаті у сторінок, що додаються в індекс, з URL буде віддалятися ідентифікатор сесій.