Как найти сворованный контент

Последние годы популярность копипаста на сайтах пошла на спад, однако некоторые умельцы до сих пор используют этот способ добычи контента. Копипаст — это когда с вашего сайта полностью или частично копируют текстовую и другую информацию, и размещают её на своей страничке. Зачастую всё это делается без вашего согласия и без указания ссылки на первоисточник.

Ищем плагиат контента

Бороться с этим можно несколькими способами — можно отключить правую кнопку мышки на сайте, однако этот способ легко обойти, отключив выполнение скриптов на странице. Можно воспользоваться скриптом, который автоматически будет дописывать ссылку на страницу, с которой воруется контент, но такую ссылку легко обнаружить и стереть. Остаётся только один способ — смириться с воровством контента с вашего ресурса, но требовать размещения активной ссылки на ваш сайт. Именно об этом процессе и будет сегодняшняя статья.

Ищем сайты, которые украли наш контент

Из такой неприятной ситуации, как копипаст с сайта, мы будем извлекать пользу. Любой контент, который вы пишите у себя на странице — автоматически защищён авторскими правами на этот текст (если вы написали его самостоятельно). Найдя того, кто нарушил ваши права на этот текст, мы можем написать нечестному веб-мастеру письмо с требованием удалить незаконно полученную информацию, или же — потребовать поставить активную ссылку на первоисточник, что нам и нужно. «Халявные» ссылки на свой сайт — это довольно значительная польза!

Для начала нам нужно определиться с реализацией поиска, ведь если вручную проверять каждую статью на плагиат — это будет очень затруднённым занятием. Поэтому будем использовать следующие инструменты:

  1. Инструменты для веб-мастеров Google
  2. Бесплатную программу «Etxt Антиплагиат»
  3. Exel
  4. Стандартный блокнот

Рассмотрим каждое действие подробно и начнём поиск.

Получаем список всех статей на своём сайте

Чтобы проверить каждую отдельную статью на плагиат, нам сначала нужно получить URL этих статей. Для этого нужно обратится к инструментам для веб-мастеров, которые предлагает поисковая система Гугл:

  1. Заходим на http://www.google.com/webmasters/tools
  2. Слева выбираем «Поисковой трафик»
  3. Жмём на ссылку «Внутренние ссылки» sobiraem-ssilki-v-google
  4. Нажимаем на кнопку «Загрузить эту таблицу» — тем самым мы скачаем список адресов всех страниц сайта.

Ссылки получили, переходим к их редактированию.

Структурируем данные с помощью Exel и стандартного блокнота

Нам нужно создать пустой документ в Exel и в первую колонку вписать ссылку на свой сайт — строчек столько же, сколько ссылок было получено. Затем, открываем скачанную таблицу из верхнего пункта и копируем полученный список во второй столбец.

Подробнее:

  • В Exel не первом этапе должен получиться список содержащий только одну главную страницу exel-1
  • Далее, открываем скачанную от Гугла таблицу с ссылками и копируем их в Exel во второй столбец. Только тут есть один момент — обращайте внимание на разделитель, иначе ссылки будут с некоторыми числами на конце и их придётся удалять.
  • Затем, копируем полученные два столбика в блокнот, делаем необходимые правки и получаем готовый список URL. spisok-url

Ищем плагиат с помощью программы «Etxt Антиплагиат»

Для начала нужно скачать эту программу, для этого можно воспользоваться ссылкой — http://www.etxt.ru/downloads/etxt_antiplagiat.zip. Скачиваем, устанавливаем, затем:

  • 1. Запускаем программу и выбираем пункт меню «Операции» — «Проверка сайта» ishem-plagiat
  • 2. Жмём «Загрузить из файла» и указываем наш сохранённый список страниц сайта в формате TXT. zagruzka-ssilok
  • 3. Ждём и получаем результаты.

Прямо в окне программы будет отображаться список ссылок на сайты, которые содержат такой же контент, как и у нас. Если процент совпадений больше 50 — скорее всего там находится наш контент, который благополучно был сворован.

Если нет ссылки на источник, то нужно найти адрес электронной почты администратора или владельца ресурса и останется только одно — написать ему письмо с просьбой поставить активную гиперссылку или удалить текст. В первом случае — мы вернём уникальность нашему контенту, а во втором — получим дополнительные ссылки для поднятия ТИЦ. Успехов!

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *