Содержание
Последние годы популярность копипаста на сайтах пошла на спад, однако некоторые умельцы до сих пор используют этот способ добычи контента. Копипаст — это когда с вашего сайта полностью или частично копируют текстовую и другую информацию, и размещают её на своей страничке. Зачастую всё это делается без вашего согласия и без указания ссылки на первоисточник.
Бороться с этим можно несколькими способами — можно отключить правую кнопку мышки на сайте, однако этот способ легко обойти, отключив выполнение скриптов на странице. Можно воспользоваться скриптом, который автоматически будет дописывать ссылку на страницу, с которой воруется контент, но такую ссылку легко обнаружить и стереть. Остаётся только один способ — смириться с воровством контента с вашего ресурса, но требовать размещения активной ссылки на ваш сайт. Именно об этом процессе и будет сегодняшняя статья.
Ищем сайты, которые украли наш контент
Из такой неприятной ситуации, как копипаст с сайта, мы будем извлекать пользу. Любой контент, который вы пишите у себя на странице — автоматически защищён авторскими правами на этот текст (если вы написали его самостоятельно). Найдя того, кто нарушил ваши права на этот текст, мы можем написать нечестному веб-мастеру письмо с требованием удалить незаконно полученную информацию, или же — потребовать поставить активную ссылку на первоисточник, что нам и нужно. «Халявные» ссылки на свой сайт — это довольно значительная польза!
Для начала нам нужно определиться с реализацией поиска, ведь если вручную проверять каждую статью на плагиат — это будет очень затруднённым занятием. Поэтому будем использовать следующие инструменты:
- Инструменты для веб-мастеров Google
- Бесплатную программу «Etxt Антиплагиат»
- Exel
- Стандартный блокнот
Рассмотрим каждое действие подробно и начнём поиск.
Получаем список всех статей на своём сайте
Чтобы проверить каждую отдельную статью на плагиат, нам сначала нужно получить URL этих статей. Для этого нужно обратится к инструментам для веб-мастеров, которые предлагает поисковая система Гугл:
- Заходим на http://www.google.com/webmasters/tools
- Слева выбираем «Поисковой трафик»
- Жмём на ссылку «Внутренние ссылки»
- Нажимаем на кнопку «Загрузить эту таблицу» — тем самым мы скачаем список адресов всех страниц сайта.
Ссылки получили, переходим к их редактированию.
Структурируем данные с помощью Exel и стандартного блокнота
Нам нужно создать пустой документ в Exel и в первую колонку вписать ссылку на свой сайт — строчек столько же, сколько ссылок было получено. Затем, открываем скачанную таблицу из верхнего пункта и копируем полученный список во второй столбец.
Подробнее:
- В Exel не первом этапе должен получиться список содержащий только одну главную страницу
- Далее, открываем скачанную от Гугла таблицу с ссылками и копируем их в Exel во второй столбец. Только тут есть один момент — обращайте внимание на разделитель, иначе ссылки будут с некоторыми числами на конце и их придётся удалять.
- Затем, копируем полученные два столбика в блокнот, делаем необходимые правки и получаем готовый список URL.
Ищем плагиат с помощью программы «Etxt Антиплагиат»
Для начала нужно скачать эту программу, для этого можно воспользоваться ссылкой — http://www.etxt.ru/downloads/etxt_antiplagiat.zip. Скачиваем, устанавливаем, затем:
- 1. Запускаем программу и выбираем пункт меню «Операции» — «Проверка сайта»
- 2. Жмём «Загрузить из файла» и указываем наш сохранённый список страниц сайта в формате TXT.
- 3. Ждём и получаем результаты.
Прямо в окне программы будет отображаться список ссылок на сайты, которые содержат такой же контент, как и у нас. Если процент совпадений больше 50 — скорее всего там находится наш контент, который благополучно был сворован.
Если нет ссылки на источник, то нужно найти адрес электронной почты администратора или владельца ресурса и останется только одно — написать ему письмо с просьбой поставить активную гиперссылку или удалить текст. В первом случае — мы вернём уникальность нашему контенту, а во втором — получим дополнительные ссылки для поднятия ТИЦ. Успехов!