Як прибрати дублі сторінок в WordPress

391

Від автора: дублі сторінок – одна з найпоширеніших технічних проблем, яка може погіршити позиції сайту в пошуку. Як з нею розібратися? Неможливо в одній статті розповісти про всіх видах дублів на всіх движках, давайте зосередимося на чомусь одному. Наприклад, на cms WordPress, так як це самий популярний движок. Як прибрати дублі сторінок в wordpress? Давайте розглянемо основні.

Як прибрати дублі сторінок в WordPress

Саме велике зло WordPress

В цьому движку є один вид дублів, який особливо небезпечний і від нього в свій час страждали дуже багато сайтів. Це так званий replytocom. З’явиться тільки в тому випадку, якщо включити в налаштуваннях обговорення деревовидні коментарі. Таким чином, з’явиться можливість відповісти на коментар якогось людини. Це дуже зручно, якщо тільки не одне але.

Якщо придивитися до url-адресою на кнопку “Відповісти”, то можна знайти там той самий злощасний відросток – replytocom. Ну і що? А те, що чим більше коментарів тепер у вас буде на сторінці, тим більше дублів. Причому 1 новий коментар породить не 1 дубль, а багато.

Все це відбувається тому, що до сторінки тепер можна буде звернутися не тільки так: http://site.ru/название-записи

Але і так: http://site.ru/название-записи?replytocom=…

Таким чином, якщо до статті залишили 100 коментарів, то з’явиться як мінімум 100 дублів, але насправді набагато більше. Я часто аналізую різні сайти з допомогою спеціальних сервісів на зразок pr-cy. Так ось, там можна спостерігати історію кількості проіндексованих сторінок.

Так от, в 2012-13 роках, коли рішення проблеми знали небагато, у багатьох сайтів було 100 тисяч – 10 мільйонів сторінок в індексі! Зараз їх у тисячі разів менше, хоча з тих пір на сайтах з’явилося набагато більше контенту.

Як раз всі ці тисячі і навіть мільйони дублів в основному були з-за дублів replytocom. Коли ж власники сайтів дізналися про проблему та про її вирішенні, вони позбавилися від дублів і з часом з пошукової видачі зникли сотні мільйонів сміттєвих сторінок!

Лікування або як позбавитися від replytocom

Варіантів тут кілька. По-перше, можна встановити плагін Yoast SEO, який використовують тисячі веб-майстрів для пошукової оптммизации своїх записів. Якщо гарненько покопатися в його налаштуваннях, то можна знайти там пункт “Прибрати replytocom”. Ставимо галочку і спимо спокійно.

По-друге, можна просто не включати деревовидні коментарі, якщо ви в них не потребуєте. Звичайно, буде не так зручно, але це найпростіший спосіб ніколи не стикатися з цими дублями.

По-третє, поставити якийсь інший плагін. Зокрема, не так давно знайшов плагін Ark hidecommentslinks, який робить відразу 2 корисних справи: замінює посилання в коментарях на клікабельний текст, а заодно і прибирає replytocom. Але плагін наведено тільки в приклад, тому що я впевнений, що це не єдине розширення, яке справляється з цією проблемою.

Четвертий спосіб більш складний – заміна кнопки відповісти. Ця кнопка повинна виводитися не стандартними засобами wordpress, а з допомогою скрипта. Зазвичай цю роботу робить програміст, або ви можете знайти готове рішення, у якому-небудь шаблоні, де стоїть самописні система коментарів.

Думаю, цих способів вам вистачить, тут ще потрібно сказати про те, що чим раніше ви зробите що-небудь для усунення дублів, тим краще. Найголовніше, щоб ваші статті не були доступні за такою адресою: http://site.ru/название-записи?replytocom=какое-то число

Тому що якщо вони недоступні (вилазить помилка 404) то з часом всі дублі, якщо вони вже потрапили у видачу, пропадуть. Якщо вони ще не встигли потрапити в видачу, то ще краще.

Простий спосіб перевірити дублі

Найпростіший спосіб – скористатися сервісом, який покаже вам, скільки сторінок вашого сайту проіндексовано пошукачем. Для цієї мети я використовую pr-cy.ru/analysis, так як вже дуже звик до нього.

В WordPress на головній сторінці ви можете бачити, скільки на вашому блозі на даний момент записів, а також скільки сторінок. Ось ви і можете приблизно прикинути, скільки сторінок має бути в індексі. Вводимо адресу свого сайту в сервіс для перевірки цих показників.

Там ви побачите дані для Яндекса і Гугла. Якщо вони приблизно відповідають вашим підрахунками і відрізняються незначно, значить, на даний момент все в порядку. Якщо ж ви бачите істотну різницю між кількістю сторінок в Індексі пошуковиків, або в обох пошукових системах це кількість сильно перевищує кількість реальних записів, треба починати бити тривогу і приймати заходи по боротьбі з дублями.

Як прибрати дублі сторінок в WordPress

Дублі на сторінках рубрик

На сторінці рубрики зазвичай міститься анонс статті та кнопка на неї повне прочитання. Так от, хоча це і не повний дубль, але все ж якась частина тексту може збігатися на обох сторінках (300-600 символів). Таким чином, ви самі у себе знижуєте унікальність. Щоб цього не допустити, бажано закривати текст в анонсах в теги noindex.

Добре, але з-за цієї сторінки рубрик взагалі можуть не проиндексироваться? Якщо ви хочете все-таки їх індексувати, рекомендую додати для кожної рубрики її унікальне опис 150-250 символів і виводити його в шаблоні рубрик – category.php.

Дублі в архівах

За замовчуванням wordpress є архіви по даті і архіви по автору. На цих сторінках також виводиться опис статей, а ще однакові title. Якщо ви в них не потребуєте, можна просто відключити. Це можна зробити за допомогою seo-плагіна. Наприклад, Yoast SEO.

Дубль на рівні домену

За замовчуванням при створенні сайту він доступний за двома адресами: site.ru і www.site.ru. По суті, для пошуковій системі це 2 різних сайту. Щоб контент не дублювався, потрібно явно вказати головне дзеркало. Це можна зробити з допомогою файлу robots.txt, прописавши в ньому наступне:

User-Agent: *
Host: site.ru

З часом поисиковые роботи зрозуміють, що варіант без www є основним дзеркалом. Тепер, якщо хтось набере www.site.ru його буде редірект на варіант без www. Також налаштувати головне дзеркало можна в новому Бета-вебмастере Яндекса.

Як прибрати дублі сторінок в WordPress

Отже, ми з вами розглянули основні дублі в wordpress, а також як від них можна позбутися. Але це далеко не всі дублі. Взагалі, якщо ви хочете провести тотальну зачистку блогу на wordpress і позбавитися абсолютно від усіх видів дублів, я рекомендую до перегляду наш курс про просування та монетизації блогів. Ви отримаєте такі знання, які знадобляться вам, коли ви вирішите заробляти серйозні гроші на сайтах.