WordPress и канонические URLs: Когда и как их использовать
Доброго дня читателям. Для большинства людей канонические URL – это вещь крайне загадочная, и зачастую они могут быть ошибочно использованы для таких операций, как 301 редирект. Пользователи знают, что такие ссылки имеют отношение к SEO, но не совсем уверены в том, как их можно использовать. Говоря же о WordPress (в противовес HTML сайту), то здесь не так легко вручную прописывать канонические ссылки для каждой отдельной страницы вашего сайта, без использования плагина, так как это идет вразрез с тем, как работает шаблон системы управления содержимым сайта.
Данная статья поможет прояснить некоторые вопросы, которые могут возникнуть у пользователей WordPress в связи с использованием канонических URL. Не WordPress пользователи также найдут эту статью полезной, потому что смогут узнать основные принципы и затем применить эти правила к собственной системе управления контентом или обогатить свой опыт разработчика. Как бы то ни было, эта статья может показаться вам сложной в освоении в том случае, если у вас не достает технических знаний о WordPress или базовой информации о HTML и поисковой оптимизации (SEO). Мы осветили все термины, чтоб вы могли с ними познакомиться в первую очередь. Но, в любом случае, из этой публикации вы сможете почерпнуть тот необходимый базис, с которого можно начать гуглить, чтоб найти больше информации для получения более полной картины.
Что представляет из себя канонический URL?
Канонический URL (также известен, как rel=canonical, канонический тег и под другими названиями) – это то, на что ссылаются поисковые системы, когда они видят дублированные версии страницы на вашем сайте или же в интернет-пространстве. Сейчас этот прием используется для решения сложных проблем, связанных с дублированным контентом, так как часто он является лучшим решением, чем использование 301 редиректа.
Возможно, вы думаете, что на вашем сайте нет дублированного контента. И это здорово, если вы следите за тем, чтоб ваш контент не повторялся на множестве страниц. В противном случае, это может привести к понижению ранга вашего сайта в поисковой выдаче.
Если на вашем сайте есть повторяющийся текст, постарайтесь серьезно подумать над этой проблемой: если бы вы были поисковой системой, которая пытается ответить на запрос пользователя, вы бы выдали этому пользователю две идентичные страницы в результатах поисковой выдачи? Конечно же, нет! Это же совершенно бесполезно. Вы бы выдали им столько разных результатов (в поисковой выдаче), чтоб они могли найти то, что им необходимо.
Таким образом, если контент на вашем сайте повторяется снова и снова, ожидаемо, что Google просто не будет ранжировать такие страницы. И это нехорошо, если вы хотите занимать хоть какие-то позиции в поисковой выдаче.
Ссылки на дублированный контент, о существовании которых вы даже не подозреваете
Хорошо, теперь давайте вернемся назад и предположим, что вы все сделали правильно и уверены в том, что все ваши страницы абсолютно уникальны. Но, возможно, на вашем сайте все же присутствуют «скрытые» дублированные URLы, о которых вы знать ничего не знаете (на самом деле они не скрытые, я просто их так назвал). Это может вас удивить, но знали ли вы что поисковики воспринимают следующие URL, как полностью самостоятельные, даже не смотря на то, что для вас это одно и то же, и отображает одинаковый контент?
http://www.examplesite.com (заметили www?)
http://examplesite.com
https://examplesite.com (заметили https?)
http://www.examplesite.com/ (заметили слэш в конце?)
http://examplesite.com/index.php
Вот почему вам нужен канонический URL в теге <head> HTML-кода всех ваших страниц. Необходимо оповестить поисковые машины о том, на какую версию типов URL приведенных выше или других они должны обращать внимание.
Это значит, что вы должны раз и навсегда решить отказаться ли вам или нет от использования www во всех ссылках вашего веб-проекта. Это должно стать вашей стратегией перелинковки сайта как внутри него, так и за его пределами. И это должны знать все, кто используют ваши URL: фрилансеры, работающие на вас, ваши партнеры, совладельцы, а также этот адрес должен быть указан во всех каталогах, где есть ваш сайт. Кроме того нужно решить, хотите ли вы слэш в конце или https (если на вашем сайте вводится специфическая информация, типа кредитных карт). Выберите один вариант и придерживайтесь его всегда. Если бы выбирать приходилось мне, я бы предпочел вариант, который используется чаще всего, чтоб снизить уровень головной боли, когда дело доходит до наведения порядка в URLах.
К счастью, если вы работаете с WordPress, большинство таких проблем решаются довольно просто. Мы расскажем вам о необходимых плагинах и действиях, которые нужно проделать далее в этой статье.
Но опять же повторюсь, что для канонических ссылок есть гораздо больше применений.
Дублированный контент, созданный таксономией
Скажем, вы написали статью и включили ее в разные категории блога и теги в WordPress (все это называется таксономией). Люди постоянно это делают. Или, например, есть у вас интернет-магазин, в котором товары заносятся в разные категории. Тогда, по замыслу, для удобства передвижения пользователей по сайту, один и тот же контент появляется по разным URL, но это приводит к появлению проблем. Например:
http://examplesite.com/store/candy/chocolate-truffles
и
http://examplesite.com/store/foods/chocolate-truffles
Вам хочется, чтоб посетители нашли эти самые «шоколадные трюфели» в обеих категориях: «сладости» и «еда». Неплохое стремление. Но на какой URL должны обращать внимание поисковые машины? Вы же помните, что они не будут ранжировать обе ссылки. Так что нужно выбрать. И вот здесь вам пригодятся канонические ссылки. Они скажут поисковым машинам «эй, на этой странице тот же контент, что и на той, пожалуйста, ранжируй эту страницу, а не ту».
Помните, что это просьба – ни одна поисковая система не обязана повиноваться вашей канонизации, и они могут ее проигнорировать, если посчитают неправильной.
Использование кроссдоменного канонического URL для дублированного контента
Это последняя причина, по которой вам нужен элемент канонический URL, который будет описан в данной статье (есть и другие, но они сложные, да и принцип использования не меняется): когда вы публикуете контент на вашем сайте, который также появляется и на других сайтах. Наиболее очевидные случаи такого дублирования – это пресс релизы. Так ваша компания публикует пресс релиз и размещает его на вашем сайте. Это вполне законно. Но, традиционно, пресс релиз – это такая штука, которую может опубликовать у себя кто угодно. Они создаются для того, чтоб ими делились и копировали. В этом заключается принцип работы сообществ дистрибьюторов, типа PRWeb. Это старый, как мир маркетинговый прием.
Но это рождает конфликт SEO интересов. Для поискового робота контент пресс релиза на вашем сайте – это то же самое, что и на сайтах его позаимствовавших. Так, где же оригинальная копия? Какую ссылку ранжировать в поисковой выдаче? Помните, что нужно выбрать только одну.
Обычно поисковые машины выбирают за вас, если только вы не предложите им свой вариант. И вы можете это сделать, использовав канонический URL. В случае пресс релизов, вы, как бы то ни было, вряд ли каждый новостной сайт будет публиковать вашу статью с каноническим URL на ваш ресурс. Помните, что для многих данный элемент не особо понятен. Я так же сомневаюсь, что кто-то будет тратить время на то, чтоб найти ресурс с исходной статьей и правильно кодировать свой HTML. Они публикуют по несколько статей в день, так что только вы можете позаботиться о правильных ссылках на вашем сайте. На вашем месте я бы поставил канонический URL на страницу, которая содержит пресс релиз, и обратился бы к копии, на странице крупного сообщества, где вы изначально разместили статью для заимствования. Например, закинем копию статьи на сайт PRweb.com (если вы используете данный сервис). Просто мои пять копеек.
Вот пример из реальной жизни, не связанный с ситуацией пресс релизов, где канонический URL пришелся весьма кстати: взгляните на статью, которую я написал о KISSmetrics около года назад:
https://blog.kissmetrics.com/click-worthy/
Вскоре после этого Entrepreneur.com разместили эту статью у себя, так как у них было соглашение с KISSmetrics.
Вот URL той статьи:
http://www.entrepreneur.com/article/231237
Теперь у нас есть одинаковый контент, на который ведут две разные ссылки. Технически это дублированный контент, а дублированный контент – это «плохо», помните? Но не стоит бояться! Если вы посмотрите на исходный код Entreprenuer.com, то вы увидите это
<link rel=”canonical” href=”http://blog.kissmetrics.com/click-worthy/” />
Это говорит поисковым системам, где находится оригинальный контент, что представляет собой правильный выход из ситуации.
Это снимает подозрение в воровстве контента в глазах поисковых систем (которые не могут иначе узнать, кому именно принадлежат легальные права на публикацию контента).
Вероятно, вам бы не хотелось иметь такой сайт, на котором публикуются только чужие материалы. Тут элемент канонический URL, вряд ли поможет вам улучшить ранжирование сайта. Так что не злоупотребляйте использованием данной тактики.
Когда вы не можете использовать канонический URL для дублированного контента с другого сайта
Мне хочется осветить один момент, так как я много раз наблюдал такую ситуацию. Если вы собираетесь написать описание компании или персональную биографию на вашем сайте я бы не рекомендовал вам использовать тот же набор слов в ваших профилях в социальных сетях или на любых других сайтах. Если вы пишите одно и то же снова и снова на странице вашей компании на LinkedIn, бизнес странице на Google Plus и т. д., вы просто дублируете ваш контент. Вы не сможете использовать канонический URL на странице, посвященной компании или человеку, и сделать отсылку к профилю в социальной сети: вам не захочется чтоб такая страница ранжировалась сама по себе. В этом случае, пожалуйста, просто пишите каждый раз новое уникальное описание.
Как использовать канонические URLs в WordPress
Это можно сделать разными способами, но я расскажу вам о лучшем варианте, который мне известен: используйте плагин WordPress SEO от Joost De Valk. Как только вы установите это расширение на вашем сайт, он начнет заботиться о вашем SEO, включая управление каноническими URL для того, что я назвал «скрытыми» URLами (смотри выше). Но все-таки стоит обратить внимание на некоторые настройки. На скрине ниже, виден экран настройки для единичной записи или страницы (так же применимо для пользовательских типов записей, если вы такие используете), и SEO-бокс WordPress содержит много полей и настроек. Для настройки канонических URL, которые пригодятся для штук типа пресс релизов и контента, дублированного на других сайтах, кликните таб “Advanced”:
Этот плагин значительно упростит для вас элемент канонический URL. Все, что нужно сделать, это ввести полный url оригинального источника вашего контента, который публикуется на данной странице. Другими словами, URL, который копирует контент, это та ссылка, которая должна использовать каноническую URL в HTML «шапки». Копированный контент теперь будет сигнализировать поисковикам о том, что он всего лишь копия. Имеет смысл, да?
Хорошо, но это всего лишь принцип. Исходя из примера, данного выше, вам может иногда захотеться указать, что вы всего лишь копируете контент, хотя это совсем не так, так как вам просто трудно контролировать распространение контента. Вы можете опубликовать пресс релиз на сайте своей компании и, если нужно, вы можете использовать атрибут для оригинального источника контента в сети синдикации, которую вы используете. В этом смысле вы будете действовать, как один из синдикаторов. (между прочим, это всего лишь мое мнение. Этот совет могут не одобрить другие SEO-эксперты. Так что используйте его на свой страх и риск. Google «клянется», что он очень хорош в идентификации оригинального источника контента, и канонические указатели – это только дополнительная подмога. Поисковые системы могут их проигнорировать).
В других случаях канонические URL, которые вы вводите, будут внутренними ссылками вашего сайта, содержащими дублированный контент. Скажем, например, вы публикуете описание вашего товара на статичной странице для оптовых покупателей. Но вы используете это же описание в разделе вашего сайта, где люди покупают товары в розницу.
Используя поле для канонического URL в SEO-настройках WordPress, вы можете подсказать поисковым машинам какую ссылку вы бы хотели, чтоб они ранжировали.
Замечание: Вам нужно выбрать версию ссылки с www или без www для каждой страницы, используя эти настройки. Плагин WordPress SEO делает это автоматически. Вам могут понадобиться эти настройки только в том случае, когда URL очень отличается или контент находится на другом домене.
Настройка https глобальной канонической URL с использованием WordPress SEO
Вот еще кое-что, что вы можете сделать с каноническими ссылками, используя плагин WordPress SEO. Если вы используете сертификаты SSL (для продаж в Интернете) вы можете сделать так, чтоб ваш канонический тег использовал https версию ваших ссылок в том случае, если страницы могут находиться и по http, и по https. Для этого идем в SEO > Permalinks и прокручиваем до «Canonical Settings» (канонические ссылки) в вашей консоли WordPress.
Кликаем на развернувшееся меню, где можно выбрать тип URL, который вы хотите сделать элементом canonical URL в теге <head> всех ваших страниц:
Когда НЕ нужно использовать элемент Canonical URL
Во-первых, прочитайте эту статью в блоге Google Webmaster Central о самых распространенных ошибках, связанных с использованием rel=canonical URL.
Во-вторых, не используйте канонические ссылки в следующих случаях:
Когда вы создаете 301 редирект
Если вы хотите создать перенаправление с одной страницы на другую для тех пользователей, которые впечатывают «старый» URL или для тех, кто кликает на «мертвые» ссылки: для их переброса на «новые» URL, необходимо использовать 301 редирект. Не надо использовать для этой цели канонические ссылки. Хотя в SEO они могут применятся практически для того же самого.
Постарайтесь понять разницу: редирект означает, что есть только одно место, где появляется какой-либо контент, и вы посылаете всех посетителей на эту страницу. Вам бы могло это понадобиться, если бы вы, допустим, начали использовать новый домен или бы изменили структуру ссылок во время перестройки сайтов. Также 301 редирект используется для перенаправления людей на www или не www версию вашего сайта (так вы можете убедиться в том, что никто не воспользуется неправильной ссылкой для входа на сайт). С канонической ссылкой вы можете располагать один и тот же контент по разным адресам в сети для пользовательских нужд, и в тоже время иметь только один оригинальный ресурс с контентом, который видим для поисковых систем. Другими словами, могут существовать многие страницы с одним и тем же контентом, которые видим для пользователей.
В 2011 Рэнд Фишкин провел интересный эксперимент, где он использовал канонические URL в «шапках» всех страниц старого домена, чтоб улучшить ранжирование нового отличного домена. И, что удивительно, это сработало. Но я не уверен, что это сработало бы сегодня.
Если вы хотите, чтоб поисковые системы проигнорировали какие-то страницы, помните, что URL -элемент rel=canonical – это не универсальное решение проблемы дублированного контента. SEO – это штука более сложная, и часто есть более выгодное решение, которое в данном случае заключается в использовании файла robots для запрета индексации файлов. И плагин WordPress SEO позволяет это сделать. Я рекомендую моим собственным SEO-клиентам не индексировать страницы, которые не являются желательными входными точками на их сайты и не представляют большой ценности для большинства посетителей. Например, вряд ли вам хотелось бы увидеть страницу «Правила и условия» или страницу авторизации в результатах поиска. Вам, наверняка, хочется, чтоб ранжировался более ценный контент: страницы интернет-магазина, описания товаров, информационные записи блога, имеющие значения.
Я также рекомендую закрыть от индексации страницы с малым количеством контента (из-за таких страниц сайт выглядит скудным), а также архивы, содержащие дублированный контент. В WordPress это авторские архивы, архивы информации и все архивы тегов, так как они содержат туже информацию, что и архивы категорий. Также можно отказаться от индексации пользовательских типов записей и их архивов, если они используются, как источники фидов для других страниц вашего сайта.
Замечание: когда вы закрываете что-то от индексации, удостоверьтесь в том, что также удалили этот контент из карты сайта, или в противном случае могут возникнуть ошибки в Google Webmaster Tools.
Подстройка ваших ссылок под канонический указатель
Помните, что выше мы говорили о выборе одной версии URL для использования во всех ваших ссылках с настоящего момента? Чтоб сделать это вам нужно либо «вычистить», либо наладить URLы на вашем сайте и везде, где используется та версия ссылок, которая вам нравится. Скажем, вы решили использовать версию вашего сайта без www. Теперь вам нужно проверить используется ли www-версия вашего сайта во внутренних ссылках и на всех тех ресурсах, где упоминается ваш сайт. Если используется, то нужно обязательно попытаться это изменить. Да, это нудная работа, которая проделывается вручную, но оно того стоит. Для того, чтоб ускорить этот процесс, если вы уверены в своих действиях, можно использовать инструмент типа Search Replace DB, что позволяет произвести быструю замену всех ссылок на сайте. Но, пожалуйста, используйте такие инструменты, только если вы понимаете, как работать с ними.
Также существуют плагины, которые через панель управления WordPress могут искать и заменять ссылки: пользуйтесь ими на свое усмотрение. Также убедитесь в том, что вы прервали всякое соединение с базой данных после использования таких плагинов, чтоб не ставить под угрозу безопасность вашего сайта. Позаботьтесь об удалении мертвых ссылок на ваши WordPress записи и страницы, используя для этого плагин Redirection, который облегчит ваш труд. Как только вы все это сделаете, войдите в ваш аккаунт Google Webmaster Tools и установите там желаемый формат ссылок. Также там можно выбрать более подходящую вам версию сайта – с www или без www.
Вместо заключения
Надеюсь, теперь вы поняли, зачем нужны канонические URL, и как они влияют на ваше SEO.
Людям, которые занимаются бизнесом и не располагают большим количеством свободного времени для написания статей, бывает сложно решить проблему дублированного контента. К счастью есть законный путь разместить один и тот же контент по разным адресам, если того требуют обстоятельства. Если уж поисковые машины предоставляют нам нужные инструменты, а создатели WordPress плагинов позволяют легко осуществить задуманное, так давайте же извлечем из этого выгоду для себя!
Перевод для читателей wpnice с сайта elegantthemes.com
Спасибо за статью. Разбираюсь сейчас с интернет магазином. Не много не поняла на счет канонических ссылок. Поясни пожалуйста. В поли каноническонго урла я вставляю http://сайт.ру/ или сайт.ру. Что я я запуталась. Спасибо за ответ.
О каком поле и где именно, идет речь?