Руководство по факторам ранжирования в системе Google: дублированный контент и синдикация
Что такое дублированный контент?
Дублированный контент относится к контенту веб-страницы, который появляется в Интернете более одного раза.
Допустим, вы пишете статью обо всех животных, обнаруженных и названых в честь Фрэнка Заппы. Потом еще кто-то копирует и вставляет ваш текст в новую веб-страницу собственного сайта. Тогда у вас обоих будет проблема дублирования контента.
Дублированный контент – это не всегда плохо или неправильно, кроме как приведенного выше примера, где прослеживается обычное воровство.
Google не будет наказывать дублированный контент. Вместо этого он будет решать, какая версия поста появится в результатах поиска, а вторую он просто проигнорирует.
Google не интересует, чей пост появился раньше. Предпочтение всегда отдаётся тому сайту, у которого высочайший авторитет.
Здесь есть технически встроенная защитная сетка. Популярный сайт никогда не будет заниматься откровенным воровством статей с других более мелких сайтов. Это не стоит того, чтобы портить свой авторитет.
И, наоборот, многие крупные сайты постоянно очищают содержания, чтобы переиздать в другом месте. Наши собственные статьи встречаются более 10 раз на разных сайтах, но это никак не влияет на наши рейтинги, потому что эти сайты низкого качества, и они не учитываются в Google.
Однако существуют вполне приемлемые способы борьбы с дублированием контента в режиме «белой шляпы».
Как управлять дублированным контентом:
- Для начала не копируйте контент с другого сайта, не спросив сначала разрешения. Это плохо для вас, для сайта, с которого вы копируете, и для читателя тоже.
- Если вы используете статьи или цитаты из другого веб-сайта, тогда давайте ссылку на первоисточник.
- Если у вас есть дублированный контент на своём собственном сайте, настройте редирект, чтобы Гугл индексировал ваши предпочтительные страницы.
- Убедитесь, что Google будет индексировать только основной домен, т. е. либо с префиксом www или без него: http://www example com или http://example com. Google может относиться к www и без версии вашего домена как к отдельному сайту, отдельной странице, что негативно скажется на видимости. Вы можете установить ваши предпочтения в консоли поиск.
- У вас могут возникнуть проблемы дублирования контента при использовании отдельной мобильной версии сайта. Использование быстро реагирующего мобильного сайта позволит решить проблему.
- Прежде чем принять статьи от писателей, дважды проверьте, чтобы они не были опубликованы в другом месте. Блогеры не всегда работают добросовестно, и если их статьи уже были ранее опубликованы, то это может вызвать проблемы видимости в поиске.
Но если у вас есть разрешение от автора и сайта, то «безопасные» способы публикации дублированного контента принесут пользу вам, автору, оригинальному сайту. Google будет счастлив.
Синдикация контента
Синдикация контента – это термин, используемый для тактического переиздания оригинальной статьи на другом стороннем сайте. Это особенно полезно, если вы издатель и писатель, который хочет более широкой аудитории.
Если синдикация контента осуществляется корректно сайтом публикации контента, тогда не должно быть никаких причин считать этот контент дублированным.
Вот несколько хороших способов SEO для синдикации контента:
- Тег rel=canonical. Самым безопасным способом избежать проблемы дублирования контента является использование тега rel=canonical, прикреплённого к опубликованной статье. Это указывает Гуглу, что связанная статья является оригинальной и, следовательно, должна быть проиндексирована.
- Тег meta noindex. В этом случае такой же принцип, как и для тега canonical. Сайт переиздания прикрепляет тег meta noindex на странице, поручив поисковику удалить страницы из своего индекса.
- Прямая ссылка на оригинал статьи. Вы также можете просто использовать прямую ссылку в самой статье. Это хороший способ, если у вас ограниченный доступ к HTML-коду вашей статьи, вы не можете прикрепить тег rel=canonical.