31.05.2018      246      2
 

Осторожно: статьи из веб-архива


Всем привет. Долгим выдался у меня перерыв – весь май проболела, за компьютер вообще не садилась. Сейчас чувствую себя немного потерянной, будто из другого измерения прибыла. Даже собственный блог с трудом воспринимаю, словно он и не мой вовсе. Пару дней заново привыкала к админке и вспоминала, чем я занималась перед тем, как слечь с пневмонией. А занималась я подготовкой поста об опасности статей из веб архивов.

Кто не знает: статьи из веб архива – это статьи с мертвых сайтов, некогда закрытых или просто брошенных своими владельцами. Со временем они выпадают из индекса, и это подталкивает отдельных умельцев выуживать их из небытия и пускать по второму кругу – для наполнения «левых» ресурсов или на продажу. Вот о последнем варианте мне и хотелось бы поговорить.

Дело в том, что люди, покупающие подобный контент, часто не догадываются об источнике его происхождения. Я сама регулярно получаю письма с предложением купить оптом уникальные статьи от 10 рублей. Но если я знаю, что за этим стоит, то некоторые наивно радуются шансу дешево наполнить свой сайт уникальными материалами. Ведь с точки зрения антиплагиатных программ статьи действительно уникальны.

А дальше происходит следующее: человек вывешивает купленные статьи у себя на сайте, предвкушая скорый взлет поисковых позиций, а потом недоумевает, почему вместо поднятия в индексе он вдруг оказывается под фильтром. Многие не понимают, что уникальность статьи и ее оригинальность – принципиально разные вещи. Текст, имеющий 100% уникальности по версии специальной программы, может иметь нулевую оригинальность с точки зрения поисковиков. Это значит, что в случае повторной публикации он будет воспринят ими как копипаст со всеми вытекающими отсюда последствиями. Неспроста «знающие» тщательно чистят подобные тексты перед публикацией.

Но даже если поисковики «забыли» о статье, нет никакой гарантии, что ее не опубликуют сразу несколько человек. В этом случае повезет только одному – первому, остальные автоматически попадут в разряд копипастеров.

Поговаривают, что это стало одной из причин закрытия магазина контента на бирже Text.ru – было много жалоб на некачественные статьи, которые после покупки и публикации оказывались не очень-то «свежими». Конечно, биржи в таких случаях наказывают «копирайтера», выдавшего свистнутый контент за свой, но владельцу пострадавшего ресурса вряд ли от этого полегчает.

Между тем в сети по-прежнему полно предложений прибрести оптом уникальный контент по бросовой цене. Я не буду сейчас рассматривать моральную сторону дела, хотя по моему твердому убеждению она имеет место быть. Поговорим исключительно о «технической». Продавцы преподносят свой товар как уникальный, и любая программа, будь то Etxt или Advego, действительно показывает сносный «уник». Вот только в интернете ничто не исчезает бесследно, и текст, замеченный поисковиками хотя бы раз, уже никогда  не станет для них «новым». Исходя из личного опыта рискну предположить, что роботы отслеживают и запоминают абсолютно всё, а чтобы не быть голословной, покажу скрин.

В своей статье Призрак сайта я рассказывала, как ругались на мой молодой блог поисковики, не находившие на нем статьи, которые когда-то были опубликованы на медицинском сайте с таким же названием. Из кабинета Bing мне вообще пришлось уйти, так как он буквально кишел битыми ссылками. Гугл был сдержаннее, но тоже каждый день ругался на отсутствующие посты. Тогда я думала, что прошло слишком мало времени со времени закрытия прежнего сайта, и что все это прекратится, как только чужие статьи выпадут из индекса – нужно лишь дождаться обновления выдачи. А не тут-то было.

Вот сегодняшний скрин из моего кабинета вебмастера в Гугле. Красным обведены статьи, которых я никогда не писала – их публиковал прежний владелец домена:

Ссылки на отсутствующие статьи

Я не знаю, когда закрылся предыдущий сайт, но свой блог я наполняю уже второй год. До этого он еще год висел пустым, вот и считайте. То есть, даже по прошествии лет Гугл помнит об однажды опубликованных статьях и продолжает их искать.

Кстати, тот факт, что их не ищет Яндекс, вовсе не означает, что он о них не знает. Яша своеобразный товарищ — молчит-молчит, а потом как выдаст за старое, за новое и за три года вперед. На картинках убедилась, которые до последнего времени его устраивали.

В общем, подумайте, стоит ли тащить подобное добро к себе на сайт. На родном домене архивные статьи можно восстановить, ничем не рискуя, на других – не факт.

Всем удачи, здоровья и хорошего настроения.


Обсуждение: 2 комментария
  1. Антон:

    И ?
    Если бы вы были знакомы с логикой поисковых краулеров, то понимали бы почему возникают эти ошибки.
    И скриншот, всего-навсего, показывает, что бот ищет урлы, а не их содержимое. Не нужно валить всё в кучу, а потом еще и выводы из этого делать.

    Ответить
    1. Inna:

      И Вам здравствуйте.

      Ответить

Ваш комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

18 − два =

Политика конфиденциальности