Еще раз про неуникальность контента. часть 2

[править] Проявления и борьба с копипастой

Примером копипасты являются цитаты, однако, как правило, цитаты разумного размера копивио не являются (не нарушают авторских прав), по этому поводу в законах об авторском праве есть оговорка, что цитирование разрешено. Тем не менее, избыточное цитирование (оверквотинг) может стать нарушением авторских прав.

Копипаста весьма распространена в Интернете: ведь скопировать чужой текст гораздо проще, чем написать аналогичный свой. Борьба с этим явлением ведется редко, так как большинству авторов все равно, а бороться некогда, да и бессмысленно. Многие публикуют свои тексты на условиях свободных лицензий, в таком случае, чтобы легально скопировать подобный текст, необходимо выполнять условия соответствующей лицензии.

Несмотря на это, борьба с заимствованиями все равно ведётся, в том числе новыми методами: например, поисковики часто стараются ставить скопированные тексты ниже оригинала. Если сайт злоупотребляет копипастой (содержит её слишком много), то он может быть подвергнут санкциям со стороны поисковиков.

С копипастой и плагиатом в диссертациях борется проект Диссернет, в основном подвергая плагиаторов общественному порицанию, но некоторых по итогам расследований лишили степеней IRL. В 2017 году копипасту Диссернет нашел в повторном приговоре Навальному и Офицерову по делу Кировлеса: заимствования присутствуют на 56 страницах из 57, хотя судья был другой.

Копированный контент ранжируется выше оригинала. Как такое возможно?

Несмотря на то что и Яндекс и Google заявляют, что сумеют отличить оригинал от копии и отдадут предпочтение именно оригиналу, практика показывает, что возможно и обратное. В каких случаях копированный контент ранжируется выше оригинала?

1. Поисковики посчитали, что оригиналом является копипаст

Такое происходит, если поисковик проиндексирует сайт-плагиатор раньше. Для нейтрализации риска работайте над улучшением индексации своего сайта (статья о способах ускорения индексации). Это на пользу продвижению.

Оба основных поисковика предоставляют официальную возможность закрепить за собой авторство на тексты. Помните нашу историю с украденной статьей и Google? Сейчас мы заранее страхуемся от таких неприятностей и закрепляем права на все публикуемые нами материалы.

В Яндексе это делается через сервис Яндекс.Вебмастер, об этом мы писали тут. А в Google права на свои новые тексты можно закрепить с помощью социальной сети Google+, мы об этом в нашей группе ВК рассказывали (кстати, подписывайтесь, там много вкусного ))).

Лирическое отступление: мы рекомендуем закреплять авторство через Вебмастер Яндекса, так как это единственный официально заявленный способ сохранить свои права. Но очень часто на форумах встречаются жалобы на то, что, несмотря на закрепление этих самых прав, авторы оригиналов ранжируются ниже копипастеров. Мы и сами такое наблюдали. Возможно, инструмент не работает так как положено, возможно, дело в причине, описанной ниже. В любом случае рекомендуем подстраховываться и заявлять об авторстве через «Оригинальные тексты» Яндекса, а вместе с этим работать над ускорением индексации нового материала.

2. Сайт, разместивший копипаст, имеет явное преимущество по другим факторам

Яндекс пока делает упор именно на том, чтобы отдать предпочтение первоисточнику. По крайней мере, такова их официальная позиция и другого они не заявляли.

Google же подтвердил, что может ранжировать первоисточник ниже копипаста, если к самому первоисточнику есть претензии по качеству.

Да, это не справедливо, но рациональное зерно в этом все же есть. Мы предполагаем, что и Яндекс применяет такую практику. Вот какую картину мы наблюдали с одним из клиентов:

Наши копирайтеры заполнили сайт ****mash.ru контентом от и до, в том числе разместили на сайте несколько статей в разделе «Новости». Сайт удобный, понятный, контент оригинальный. Какое-то время сайт занимал очень хорошие позиции в Яндексе, в том числе по запросам из статей. Но ссылочную массу сайт наращивал самостоятельно – за счет закупки ссылок на биржах с 2013 года. Не так давно он попал под фильтр Минусинск (печально, ведь сайт действительно неплохой). Позиции в Яндекс по всем фронтам были занижены (в Google он по-прежнему в топ-3). И что мы видим по текстам?Еще раз про неуникальность контента. часть 2По прямому вхождению целого абзаца из написанной нами статьи (и уже проиндексированной на сайте нашего заказчика), преимущество отдано непонятному сайту, который скопировал и разместил эту статью через 2 месяца после публикации оригинала. Как-то так. Хочется еще добавить – это Минусинск, детка…

[править] Примечания

  1. http://www.rbc.ru/rbcfreenews/58a6704a9a7947408f5b9d36
  2. https://meduza.io/news/2017/07/26/match-tv-ob-yavil-kopirovanie-chuzhih-tekstov-traditsionnoy-praktikoy-zhurnalistov
Копипаста относится к темам:

Авторское правоИнтернет

Copy right ?

Основы Авторское право • Копилефт • Автор • Авторская статья • Авторство (болезнь википедистов) • Антикопирайт (субкультура) • Добросовестное использование • Запрещённое число • Компьютерное пиратство • Интернет-пират • Лицензия википроекта • Лицензионная политика википроектов • Копивио • Копипаста (в википроектах) • Копирайт • Копирайтоголизм • Копирастия • Личные авторские права • Мультиавторская статья • Оверквотинг • Перевод • Пользовательское соглашение • Правообладатель • Скачивание • Торрент • Цитата
Лицензии Общественное достояние • Свободная лицензия • Creative Commons (лицензии Creative Commons • текст CC-BY-SA 3.0) • GFDL (спам • текст v.1.3.) • GPL • WTFPL • Копирайт ВП СССР
Инциденты Ad Marginem против Андрея Чернова • Promusicae vs Telefonica • Ведомости против РБК • Дело Валентина Киселёва • Дело Сергея Абрамова • Заимствование компанией Blizzard идей у собственных клиентов • Обращение Донцовой и Устиновой к Яндексу • Охрана графиков • Суд Perfect 10 с Яндексом • Троллинг Дуровым правообладателей • Угроза отключить Интернет
Защита копирайта DRM • RIAA • SOPA • Antipiratbyrån • MediaDefender • Антипиратский закон • Страйк на YouTube
Люди и проекты Fernrohr • Антикопирайт (википроект) • Время менять копирайт • Игорь Пугач • Steal This Film • Релиз-группа (R.G. Механики • Salat Production) • Blackcats-games.net • BitTorrent DNA • RetroShare • BearShare • FreeNet • Fuck You Bill • ICM • Либрусек • Флибуста • Sci-Hub
Разное Авторское право на YouTube • SEO-троллинг • Право первого автора

Интернет — Всемирная Паутина

Понятия Веб ( • • • ) • Блогосфера • Бан • Баннер • Браузер • Веб-сёрфинг • Видео (блоггер) • Викисреда • Изображения • Интернет-деньги • Интернет-реклама • Краудсорсинг • Онлайн-игры • Поисковая система • Пользователь • Хостинг • As We May Think • DNS • HTTP • FTP • Cookies • CMS • URL • Рунет (история) • Веб-камера • Геолокация • Геотаргетинг • Загрузка • Оверквотинг • Оффтопик • IRC • Копипаста • Межсистемность • Онлайн • Отключение • Оффлайн • Скачивание • Субкультура • Бизнес • Торговля • Конкуренция
Места Booru • Архив • Блог • Веб-портал • Веб-служба • Веб-форум • Видеохостинг • Вики • Домен (Поддомен) • Имиджборд • Магазин • Новости • (СМИ) • Облако • Отвечальник • Персональный сайт • Рувап • Агрегатор (товаров) • Сервис • Сервис-провайдер • Сокращение ссылок • Соцсеть • Торрент • Форум • Фотохостинг • Файлообменник • Шокирующий сайт • Энциклопедия-луркмор
Известные сайты и сервисы Alexa • Башорг • Бобрдобр • Delicious • Demotivation.me • Dirty.ru • • Foursquare • FriendFeed † • • Instagram • Last.fm • RapidShare • Reddit • • Webmoney • Википедия • • Живой Журнал • Лепрозорий • Луркоморье • • Хабрахабр • Яндекс • ImageShack • Mister Wong • Sci-Hub • Smi2.ru • TJ • Фотохостинг Япикс
Известные люди Артемий Лебедев • Билл Гейтс • Брэд Фитцпатрик • Вэннивар Буш • Джимбо Уэйлс • Джулиан Ассанж • Игорь Ашманов • Сергей Брин • Стив Джобс • Марк Цукерберг • Миша Вербицкий • Ларри Пейдж • Павел Дуров • Эдвард Сноуден • 10 самых важных людей в сети • 33 перспективных россиянина
Представители Администратор • Аноним • Зарегистрированный участник (Блоггер • Википедист) • Геймер • Ламер • Модератор (премодерация) • Моралфаг • Основатель • Платный аккаунт • Стример • Фолловер • Фрилансер
Основы Авторизация • Аккаунт • Виральность • Инвайт • Лулзы • Профиль • Личное сообщение • Пруфлинк • Рейтинг • Репрезентативность • Репутация • Звания • Цензура •‎ Регулирование •‎ Переписка •‎ Правила сайта •‎ Предупреждение • Смайлик (каомодзи) • Блокировка участника • Деструктивные действия • Интернет-зависимость • Информационный суверенитет • Мем • Семантическая паутина • Сленг • Троллинг • Удаление • Интернет-сообщество • Просмотры
Праздники и даты Новый Год • День защитника Отечества • Женский день • День смеха • День интернета • Пасха • День Победы • День знаний • Хэллоуин • День народного единства • Рождество • Каникулы
Прочее Великая Сеть • Виртуальная этнография (этничность) • Всемирный запуск IPv6 • Деревенский Интернет • Домашний Интернет • Закон Годвина • Интернет-археология • Интернет-историк • Интернет в космосе • Интернетология • История российского Интернета • Ностальгия по прошлому • Правила интернетов • Проекты об истории Рунета
Связанное @ • Голосование • Ё • Жалоба • Интеллектуал • Краудфандинг • Мат • Приветствие • Рак • Рейтинг • Секс (виртуальный) • Травля • Файл • Флуд • Цитаты • iPhone • iPad
Исследования Восприятие творчества в цифровую эпоху • Задержка потребления контента

Часть 1. Когда можно, а когда нельзя использовать копипаст

Вопрос уникальности веб-контента поднимался нами неоднократно. Мы уже писали и про техническую уникальность текстов (тут) и про смысловую (здесь). И про то и другое вместе (вот тут).

И все-таки «уникальность» по-прежнему вызывает массу вопросов у наших пользователей. Это видно по комментариям к статьям, по запросам в нашу службу поддержки, по популярным обсуждениям на форумах.

Мы попробовали еще раз расставить точки над Ё и ответили на самые частые вопросы, связанные с понятием «уникальность контента». Статья получилась такой объемной, что пришлось разбить её на 2 части:

Часть 1:

Часть 2:

Копипаст для владельца сайта – блокировка сервиса

Любой сайт начинает жизнь с прохождения процесса индексации (добавление ресурса в базу данных конкретной поисковой системы). Цель любого веб-мастера – протолкнуть свой сервис в верхние строчки поисковой выдачи. Индексацией занимаются роботы поисковой машины, задача которых – проверить на копипаст, уникальность и схожесть с другими ресурсами контент нового сайта. Совпадения выражаются в процентном соотношении, и если статьи будут полностью скопированы с уже проиндексированного сайта, контент будет расцениваться как плагиат. А, как известно, плагиат – это воровство материала и нарушение авторских прав. Плагиат карается законом, не менее лояльны в этом отношении и меры поисковиков.Еще раз про неуникальность контента. часть 2

Страницы сайта, на которых был обнаружен копипаст, не будут допущены к индексации или же ресурс целиком вылетит из индекса обоих поисковых систем («Яндекса» и Google). Это значит, что поисковые запросы будут игнорировать этот сайт, и он никогда не выйдет в результатах их выдачи. Остается только пожалеть все усилия по раскрутке площадки, потраченные впустую деньги и самого владельца, которого к тому же могут привлечь к уголовной ответственности за плагиат и нарушение авторских прав.

Копипаст для автора – крест на писательской карьере

Многие копирайтеры, начиная свой путь к вершине писательского мастерства, совершают глупую ошибку. Желая создать статьи как можно быстрей, они воруют материалы с других сайтов и сдают их заказчикам либо размещают их на текстовых биржах для продажи. Даже если горе-автору удастся перехитрить заказчика, биржа обязательно проверит уникальность статьи на наличие плагиата и накажет его за копипаст. Программа, специально созданная для этих целей, определяет уникальность текста в процентном соотношении и выдает ссылки на сайты, с которых была украдена информация.Еще раз про неуникальность контента. часть 2

К недобросовестному автору применяются строгие меры: снижение рейтинга, отрицательные отзывы и даже блокировка аккаунта. А с большим количеством негативных отзывов и низким рейтингом ему будет очень трудно снискать доверие заказчиков. Как известно, для райтера репутация – это все, поэтому тем, кто хочет сделать карьеру успешного копирайтера, лучше не прибегать к копипасту.

[править] Копипаста в википроектах

        Основная статья: Копипаста в википроектах

Копипаста может проявляться в википроектах. Ей, в частности, способствуют механизмы экспорта и импорта страниц, внедренные в движок MediaWiki, а также широкое распространение свободных лицензий. В русской Википедии разрешена копипаста контента, перешедшего в общественное достояние, например из Энциклопедического словаря Брокгауза и Ефрона (см. Брокгаузификация), а также из проектов с лицензией CC-BY-SA 3.0. В проекте ALL правилами разрешена копипаста любых защищённых авторским правом материалов, но только с указанием источника. По факту источник часто не указывается, как, впрочем, и в других проектах (в лучшем случае указывается в описании правки).

[править] Тривия

◄ ►

А еще с ней можно говорить

Но бесполезно ей что-то доказывать

Стоит обратить внимание на цитату: «Человечество погубят две вещи: блоги и копипаст.» Стоит обратить внимание на цитату: «Человечество погубят две вещи: блоги и копипаст.» Стоит обратить внимание на цитату: «Человечество погубят две вещи: блоги и копипаст.» Стоит обратить внимание на цитату: «Человечество погубят две вещи: блоги и копипаст.» Стоит обратить внимание на цитату: «Человечество погубят две вещи: блоги и копипаст.» Стоит обратить внимание на цитату: «Человечество погубят две вещи: блоги и копипаст.» Стоит обратить внимание на цитату: «Человечество погубят две вещи: блоги и копипаст.» Стоит обратить внимание на цитату: «Человечество погубят две вещи: блоги и копипаст.» Стоит обратить внимание на цитату: «Человечество погубят две вещи: блоги и копипаст.» Стоит обратить внимание на цитату: «Человечество погубят две вещи: блоги и копипаст.» Стоит обратить внимание на цитату: «Человечество погубят две вещи: блоги и копипаст.» Стоит обратить внимание на цитату: «Человечество погубят две вещи: блоги и копипаст.» Стоит обратить внимание на цитату: «Человечество погубят две вещи: блоги и копипаст.» Стоит обратить внимание на цитату: «Человечество погубят две вещи: блоги и копипаст.» Стоит обратить внимание на цитату: «Человечество погубят две вещи: блоги и копипаст.» Стоит обратить внимание на цитату: «Человечество погубят две вещи: блоги и копипаст.» А разгадка одна — безблагодатность.

Что делать, если ваш контент копируют?

Про закрепление авторских прав и ускорение индексации для предотвращения неприятных ситуаций мы уже рассказали выше. Поговорим о том, что можно сделать, если факт воровства уже случился.

Вариантов несколько, но гарантированных нет:

Вариант 1. Писать в службы поддержки поисковых систем

Пишем в Яндекс вот здесь: https://yandex.ru/support/zout_abuse/troubleshooting/
Если честно, то вряд ли вам ответит живой человек. Стандартный ответ Платона:
«Чтобы защитить свои авторские права, мы рекомендуем Вам обратиться к администратору указанного сайта и/или к провайдеру, на сервере которого он находится. Поисковая система Яндекс является лишь зеркалом интернета, поэтому мы не правомочны разбираться в вопросах плагиата. Тем не менее, Ваш пример передан в поисковый отдел, он поможет нам в работе над алгоритмами ранжирования

Спасибо за письмо!»
Но попытаться стоит.

Пишем в Google вот здесь: https://www.google.com/webmasters/tools/dmca-notice?hl=ru&pid=0
Важно предоставить убедительные доказательства того, что вы автор. Согласно закону США о защите авторских прав в цифровую эпоху (DMCA), Google обязан рассмотреть вашу жалобу.
В нашей практике был случай, когда обладатель авторских прав на фотоматериалы, обратился в Google с обоснованной претензией

Нарушитель был наказан. К сайту-плагиатору был применен фильтр. Вот здесь https://www.lumendatabase.org/notices/11603800 можно посмотреть список всех претензий, принятых на рассмотрение и одобренных.

Вариант 2. Пишем плагиатору

Если на сайте-копипастере есть контакты, необходимо написать претензию с требованием убрать скопированные с вашего сайта материалы или же поставить на вас ссылку, как на первоисточник. К письму можно присовокупить вот такую фразу:

«Согласно статье 1255 ГК РФ ч. 2, 2., Автору произведения принадлежат следующие права:

  1. исключительное право на произведение;
  2. право авторства;
  3. право автора на имя;
  4. право на неприкосновенность произведения;
  5. право на обнародование произведения.

В случаях нарушения исключительного права на произведение, автор вправе, в соответствии с пунктом 3 статьи 1301 ГК РФ, требовать по своему выбору от нарушителя вместо возмещения убытков выплаты компенсации в размере от десяти тысяч рублей до пяти миллионов рублей».

Понятно, что тащить дело в суд вы вряд ли будете, но пригрозить можно.

Нередки случаи, когда владельцы сайта-плагиатора не в курсе того, что их контент ворован. Они купили его у какого-нибудь горе-фрилансера и уверены, что получили оригинальные материалы. Вот здесь мы рассказывали о том, как лендинг, созданный нами, перепродали. Вопрос был решен в пользу нашего клиента.

Вариант 3. Пишем хостингу

Чтобы узнать, на каком хосте находится сайт-плагиатор, воспользуйтесь сервисом http://www.whoishostingthis.com/. Если это небольшой сайт, то сервис покажет вам хостинг. Если же ваш обидчик крупный ресурс, арендующий отдельный сервер, то вряд ли.

Сообщите админам хостинга о нарушении ваших прав. Предъявите доказательства. По идее, хостинг должен отреагировать и снять скопированные материалы с сайта-плагиатора или перенаправить эти требования владельцам сайта.

Выбор тематики

По этому пункту можно писать отдельный мануал, поэтому я постараюсь коротко осветить основные моменты:

  • Тематика на самом деле может быть любой, где есть информационные запросы. Информационные запросы – это запросы про “Как?”, “Где?”, “Почему?”, “Сколько?”, “Чем?”, “Что?”. И ещё множество различных вариантов. Все статейные сайты строятся на подобных ключах. Обратные к информационным запросам являются конверсионные (коммерческие), типа “Заказать”, “Купить”, “Сколько стоит” и т. д.
  • Выбранная тематика должна иметь достаточно трафика. Достаточно – это суммарная частотность основных высокочастотных запросов (ВЧ) должна составлять несколько десятков (а лучше сотен) тысяч показов по wordstat (https://wordstat.yandex.ru/).
  • Тематика не должна быть запрещена правилами Адсенс (например, сайты про алкоголь запрещены, на страницы об алкоголе ставить блоки рекламы нельзя). Все правила можно прочитать здесь: https://support.google.com/adsense/answer/48182?hl=ru
  • Идеальная ситуация, когда в выбранной тематике есть рекламодатели. Проверить рекламодателей можно просто пройдясь по инфо-сайтам этой тематики. Если в рекламных блоках показывается тематическая реклама (сайт про окна и реклама про окна), то все хорошо. Второй вариант – вбить основные запросы (информационные, не коммерческие!) в поисковик и посмотреть, что показывается в рекламных блоках на страницах поисковой выдачи. Если там много рекламодателей и они тематические – ок.
  • Почему предыдущий пункт я не считаю критическим – есть много ниш, где нет целевой рекламы, но большие объемы трафика (те же рецепты, новости и т. п.), и заработок на таких проектах может быть существенным (хотя при прочих равных он будет ниже, чем в нишах, где есть рекламодатели).
  • Вы должны найти для себя золотую середину – больше трафика, но дешёвого или меньше, но более дорогого. Так или иначе, монетизироваться будет любой трафик. И если для нормальных статейников это критический вопрос (т.к. нужно окупать вложения в контент), то для копипастных сайтов поле для экспериментов куда шире. Моя рекомендация – смотреть в сторону золотой середины: с первыми проектами не лезть в темы, где уже огромное количество конкурентов (например, строительство), но и не заниматься темами про фиалки (где нет нормальных рекламодателей). Поверьте, стоит немного включить фантазию – и вы удивитесь, сколько вокруг проблем и вопросов, которыми интересуются люди.
  • Мой совет – не стоит брать сезонные запросы (шубы, лыжи, купальники и т. д.).

Более конкретных советов я не дам. Любые подходы, дающие нужный результат, правильные.

Если вы вообще не представляете, как выбрать тематику, ниже я расскажу о еще нескольких подходах.

Поисковые подсказки Google и Яндекс

Обратите внимание на поисковые подсказки, в том числе внизу страницы. Поисковая выдача Яндекс:

Поисковая выдача Яндекс:

Еще раз про неуникальность контента. часть 2

Поисковая выдача Google:

Еще раз про неуникальность контента. часть 2

Алгоритм работы с этим инструментом следующий: вбиваете разные слова и смотрите, какие идеи волнуют людей. Как минимум, это интересно. Как максимум, найдёте на первый взгляд не очевидные зоны интересов для ваших проектов.

Можно начать со слов «почему, зачем, как, какая, какой» и т. д. Или задавать более предметные запросы: «ремонт, чтение, стипендия, субсидия, оформление» и т. п. (подборка слов случайная). Смотрите, чем интересуются люди.

Правая колонка Wordstat

Это еще один интересный источник для идей. Вбили в wordstat слово “субсидия” (например), и смотрите в правой колонке, что там народ ищет ещё. Тоже большой источник инсайтов.

Еще раз про неуникальность контента. часть 2

Чужие сайты

Самый простой способ поиска идей – чужие сайты.

Решайте сами, насколько для вас этот способ этичный, но факт остаётся фактом: можно просто походить по форумам для веб-мастеров или по поисковой выдаче, и искать сайты разной тематики, прикидывая их под себя. Я не говорю, что так нужно делать. Но так делают, причём довольно часто.

Если вы потратите день на поиск зон интересов на женских/мужских/тематических форумах или сообществах, то у вас будет несколько десятков идей, о чём можно рассказать на сайте.

Берёте ручку и листик (word, excel, xt – по вкусу) и выписываете потенциальные зоны интересов.

Личные наблюдения

Начните во всём и везде видеть ниши. Всматриваться, искать, вникать. Увидели объявление, встретили что-то интересное на улице (автомобиль с рекламой, например), посетили выставку, познакомились с человеком новой для вас профессии – это всё подсказки. Это всё идеи.

Ходите с широко раскрытыми глазами, задумывайтесь над каждым предметом, который вы видите: может ли он быть зоной интересов юзеров? Скоро вы поймёте, что информационные запросы есть вокруг практически любой темы и предмета, от шубы до тротуарной плитки.

Монетизация сайта

Самый короткий пункт мануала – устанавливаем рекламу когда сайт достигнет посещаемости хотя-бы в 100 уникальных посетителей в сутки.

До этого момента просто нет смысла – хоть сколько-то значимых денег на малом трафике всё равно не будет. Кроме того, среди владельцев статейников есть наблюдение, что быстрая установка Адсенса очень не нравится Яндексу, а именно он, как правило, даёт нам первый трафик. В итоге можно поспешить и откинуть проект в развитии назад.

Т. е., реклама устанавливается примерно на 4-6 месяце (в зависимости от тематики, объёмов трафика в нише, успеха и роста проекта в целом).

Как ставить рекламу Адсенс – копируете код ваших рекламных объявлений и устанавливаете себе на сайт. В сети огромное количество роликов и статей на эту тему, не вижу смысла их повторять.

Данный мануал подошёл к концу. Механика сама по себе простая, и в этом её надежность (что и подтверждают сайты, которым по 2 года и более).

Копипаста с точки зрения авторского права

Согласно CC-BY-SA-3.0 и GNU FDL, используемым на Фэндоме, текст может быть добавлен в страницу в следующих случаях:

  1. Если текст является общественным достоянием;
  2. Если вы — автор этого текста и согласны с его свободным распространением согласно этим лицензиям;
  3. Если текст не является объектом авторского права (законы, кодексы, фольклор, тривиальные утверждения и т.д.);
  4. Если правообладатель дал разрешение на распространение своего произведения согласно этим лицензиям.

В остальных случаях копипаста фактически является нарушением законов об авторском праве. Например, статья 146 УК РФ говорит следующее:

1. Присвоение авторства (плагиат), если это деяние причинило крупный ущерб автору или иному правообладателю, — наказывается штрафом в размере до двухсот тысяч рублей или в размере заработной платы или иного дохода осужденного за период до восемнадцати месяцев, либо обязательными работами на срок до четырехсот восьмидесяти часов, либо исправительными работами на срок до одного года, либо арестом на срок до шести месяцев.

2. Незаконное использование объектов авторского права или смежных прав, а равно приобретение, хранение, перевозка контрафактных экземпляров произведений или фонограмм в целях сбыта, совершенные в крупном размере, — наказываются штрафом в размере до двухсот тысяч рублей или в размере заработной платы или иного дохода осужденного за период до восемнадцати месяцев, либо обязательными работами на срок до четырехсот восьмидесяти часов, либо исправительными работами на срок до двух лет, либо принудительными работами на срок до двух лет, либо лишением свободы на тот же срок.

3. Деяния, предусмотренные частью второй настоящей статьи, если они совершены:

а) утратил силу;

б) группой лиц по предварительному сговору или организованной группой;

в) в особо крупном размере;

г) лицом с использованием своего служебного положения, — наказываются принудительными работами на срок до пяти лет либо лишением свободы на срок до шести лет со штрафом в размере до пятисот тысяч рублей или в размере заработной платы или иного дохода осужденного за период до трех лет или без такового.

Примечание. Деяния, предусмотренные настоящей статьей, признаются совершенными в крупном размере, если стоимость экземпляров произведений или фонограмм либо стоимость прав на использование объектов авторского права и смежных прав превышают сто тысяч рублей, а в особо крупном размере — один миллион рублей.

Оригинал копипасты найти обычно несложно — достаточно лишь набрать в поисковике первые слова предположительно копипасты, чтобы найти, не было ли их где-то ещё. Однако даже в случае совпадения нельзя исключать вероятность того, что это был так называемый «феномен Википедии» — то есть текст был скопирован не оттуда на википроект, а наоборот. Иногда бывает и так, что оба текста скопированы из третьего источника.

Поиск доноров для получения контента

Снова вспоминаем о том, о чём говорили в самом начале: что сейчас важно для поисковых систем при оценке качества разных документов. Таким образом, если мы возьмём контент, который уже проиндексирован ПС, но который в её понимании является недостаточно качественным (не полным, плохо оформленным, имеющим мало добавочной ценности с точки зрения пользы для конечного пользователя), то мы можем его улучшить и использовать для создания более качественных (в глазах ПС) документов

Таким образом, если мы возьмём контент, который уже проиндексирован ПС, но который в её понимании является недостаточно качественным (не полным, плохо оформленным, имеющим мало добавочной ценности с точки зрения пользы для конечного пользователя), то мы можем его улучшить и использовать для создания более качественных (в глазах ПС) документов.

Это и определяет нашу зону поиска по донорам для каждого из отобранных нами запросов. Нам нужны старые сайты, у которых текст имеет плохую разметку, не имеет сопровождающих картинок, таблиц, видео, имеет плохую читабельность (т. е. низкие поведенческие факторы, далее ПФ), не имеют адаптивной вёрстки (снова плохие ПФ, только в мобильной выдаче).

И при правильном подходе, эти документы будут действительно нести больше смысла и пользы конечному пользователю, так как:

  • Вся информация будет собрана в один документ.
  • Будет убрана вся “вода” и повторения.
  • Контент будет грамотно оформлен.
  • Будут добавлены недостающие элементы (добавочная ценность в виде таблиц, списков, картинок и т. д.).
  • Страница будет иметь высокие показатели ПФ (как минимум, за счёт размеров и правильного оформления).
  • Страница будет иметь множество вариантов текстовых вхождений по этой зоне интересов, высокий показатель LSI и собирать много трафика по НЧ запросам из длинного хвоста.
  • Страница будет оптимизирована под конкретный низкоконкурентный запрос в глазах ПС.

Важные уточнения:

Источниками не должны быть сайты типа “банки.ру” или “как просто”, то есть не лидеры ниши и не трастовые старые порталы. Нужны сайты с дизайном а-ля 90-е, на которых тексты выложены простынёй, мелким шрифтом, без абзацев, в идеале без картинок и видео. В общем тут надо что называется – “набить глаз”. После поиска нескольких десятков статей – нужные сайты начинаешь видеть сразу. Количество источников определяется объёмом текстов на донорах. В идеале суммарный объём текста должен быть 30-40 тыс. символов на статью. Обычно это достигается с 5-7 доноров. Если видим, что нормальных текстов на донорах нет – снижаем объём до 20 тыс. знаков. Если делать статьи ещё меньше – результат в виде трафика тоже сильно уменьшается

Важно чтобы тексты не были рерайтом друг друга. Желательно, чтобы с каждого (одного) отдельного источника на ваш сайт были взяты тексты не более чем в 2-3 статьи

Как показывает практика, в Гугле найти подобных доноров гораздо проще, им и рекомендую пользоваться. Поиск источников занимает примерно 1 рабочий час на 10 статей. Таким образом, вручную можно за день-два найти исходники на все 100 статей под 1 сайт.

Законный копипаст. Как сделать сайт на клонированных материалах?

Если вы все же решили остановить свой выбор на копипасте (а он при правильном подходе тоже способен приносить доход), вам нужно ознакомиться с правилами законного «клонирования» материала:

  1. Владелец или сам автор должны дать вам разрешение на выкладывание индексированной ссылки их сайта под статьями вашего ресурса.
  2. Допустимо использование белого (в редких случаях серого) копипаста.
  3. Лучше создать один сайт с уникальными текстами, чем 10 площадок с клонированными статьями.
  4. Копипаст в небольших масштабах (30 процентов) не опасен, но это условие относится к сайтам, существующим уже 2-3 года.
  5. Перед созданием сайта на копипасте заполните его 20-25 уникальными статьями, дождитесь их индексации, и в случае успешного результата дозированно разбавьте контент скопированной информацией.
  6. Большое значение имеет и частота обновления информации на вашем сайте, поэтому как можно чаще добавляйте новые статьи.
  7. В любом случае белый копипаст – это не столь качественный контент, как, например, копирайтинг. Даже при условии соблюдения всех требований предпочтение отдается площадкам с уникальными материалами.