Legal framework for protecting web resources   from harmful parsing

R Demina; D Shukralieva

Специальные вопросы регулирования и охраны цифровых технологий

Special issues of regulation and protection of digital technologies

Специальные вопросы регулирования и охраны цифровых технологий

Special issues of regulation and protection of digital technologies

102

Р. Ю. Демина,

кандидат технических наук, доцент,

Астраханский государственный университет

имени В. Н. Татищева

Д. Э. Шукралиева,

аспирант, старший преподаватель,

Астраханский государственный университет

имени В. Н. Татищева

ПРАВОВАЯ БАЗА ЗАЩИТЫ WEB-РЕСУРСОВ  

ОТ ВРЕДОНОСНОГО ПАРСИНГА

Аннотация.

В последнее время наблюдается тенденция постоянного увели-

чения создаваемого пользователями мировой сети контента и его нелегитимно-
го заимствования с целью получения личной выгоды. В связи с этим становится
актуальным вопрос защиты общедоступной информации от несанкционирован-
ного копирования. Проанализировано законодательство Российской Федерации
в данной сфере, на основании чего предложено техническое решение по защите
web-ресурсов от вредоносного парсинга.

Ключевые слова

: парсер, дезинформация, пользовательское соглашение

LEGAL FRAMEWORK FOR PROTECTING WEB RESOURCES  

FROM HARMFUL PARSING

Abstract.

Recently, there has been a trend of constant development of digital

technologies, which has led to the simplification of unauthorized borrowing
of information resources. In this regard, the issue of protecting publicly available
information from unauthorized copying becomes urgent. A technical solution has been
proposed that would not contradict the legislation of the Russian Federation.

Keywords

: parser, imposition, user agreement

Введение.

В цифровом обществе информационный контент является объек-

том рыночных отношений. Стоимость различной информации может варьироваться
в неограниченно широком диапазоне. Злоумышленники или мошенники использу-
ют информацию для совершения различных преступлений. Для сбора информации
применяются различные технологии такие как: промышленный шпионаж, подкуп
сотрудников или автоматизированный сбор общедоступных сведений, так называе-
мый парсинг. Автоматизированный сбор информации с указанных интернет-ресур-
сов возможно осуществить с помощью специального программного обеспечения,
онлайн-сервиса или скрипта. Парсеры копируют необходимые данные с заранее пе-
речисленных веб-ресурсов и формируют выходные данные в нужном формате.

Основная часть.

Основным направлением деятельности вредоносных пар-

серов является автоматизированный сбор персональных данных пользователей,
интеллектуальной собственности, финансово-значимого контента. Собранная
информация может быть использована как для перепродажи или собственного

Специальные вопросы регулирования и охраны цифровых технологий

Special issues of regulation and protection of digital technologies

Специальные вопросы регулирования и охраны цифровых технологий

Special issues of regulation and protection of digital technologies

103

несанкционированного использования, так и для совершения компьютерного
преступления.

Так, например, в августе 2023 г. сервис мониторинга внешних цифровых

угроз компании Solar AURA [1] зафиксировал массовую фишинговую рассылку от
лица следственных органов с требованием ознакомиться с материалами уголовно-
го дела.

При рассмотрении полученного электронного письма были отмечены сле-

дующие признаки, которые у обычного пользователя обычно не вызывают
подозрений:

– домены максимально похожи на настоящие;
– при обращении к адресату рассылки указаны персональные данные: ФИО,

паспортные данные и адрес регистрации;

– в электронном письме указан номер уголовного дела, полученный из от-

крытых источников.

Такого рода данные могут быть получены путем парсинга соответствующих

сайтов, на которых размещена общедоступная информация о материалах уголов-
ных дел.

Злоумышленники не использовали для передачи материалов уголовного дела

вредоносный ZIP-файл, так как существует вероятность, что письмо с таким вло-
жением сервис электронной почты распознает как «СПАМ». Поэтому для переда-
чи информации был использован файлообменник. Предполагалось, что при полу-
чении будет осуществлен переход по указанной ссылке и загрузка содержимого.
Вредоносное программное обеспечение было замаскировано под программу рас-
познавания текста.

Парсинг считается относительно безобидным явлением в сфере информаци-

онных технологий. Но приведенный выше пример наглядно демонстрирует нега-
тивные последствия от применения парсеров мошенниками.

В связи с этим становится актуальным вопрос защиты общедоступной ин-

формации от несанкционированного копирования. Для эффективного противодей-
ствия вредоносным парсерам необходимо разрабатывать современные правовые
и технические решения. Для этого необходимо проанализировать существующие
нормативно-правовые акты с различных точек зрения.

В нормативно-правовых актах Российской Федерации по защите информа-

ции отсутствует определение технического термина «парсинг», поэтому рассмо-
трение вопроса правовой защиты web-ресурсов от вредоносного парсинга необ-
ходимо начать с Конституции Российской Федерации. В статье 29 Конституции
Российской Федерации упомянуто, что каждый гражданин Российской Федерации
вправе свободно осуществлять поиск и получение информации любым законным
способом [2]. В Федеральном законе «Об информации, информационных техно-
логиях и о защите информации» № 149 от 27 июля 2006 года также подтверж-
дено: «Информация, размещаемая ее обладателями в сети «Интернет» в формате,
допускающем автоматизированную обработку без предварительных изменений
человеком в целях повторного ее использования, является общедоступной инфор-
мацией, размещаемой в форме открытых данных» [3].

Специальные вопросы регулирования и охраны цифровых технологий

Special issues of regulation and protection of digital technologies

Специальные вопросы регулирования и охраны цифровых технологий

Special issues of regulation and protection of digital technologies

104

В примечании к статье 272 Уголовного кодекса Российской Федерации дается

определение компьютерной информации. Компьютерной информацией считают-
ся сообщения, данные, сведения, которые представленные в форме электрических
сигналов, независимо от средств их хранения, обработки и передачи.

Анализ указанных нормативно-правовых актов показывает, что данные, вы-

ложенные правообладателем без ограничений в сети «Интернет», являются обще-
доступными и могут автоматизировано собраны.

Однако если парсер был разработан и использован злоумышленниками при

атаках на web-ресурсы и собранные сведения в дальнейшем были использованы
для совершения противоправных действий, то может быть применена статья 273
Уголовного кодекса Российской Федерации «Создание, использование и распро-
странение вредоносных компьютерных программ». Использование парсеров для
умышленного нанесения ущерба или несанкционированного копирования инфор-
мации влечет за собой риск уголовной ответственности [4].

Из приведенного выше анализа можно сделать вывод, что парсинг об-

щедоступной информации сам по себе не является преступлением. Но прак-
тика показывает, что данный процесс очень часто предшествует совершению
преступления. Необходимо рассмотреть возможность защиты пользователей
и владельцев информации от несанкционированного автоматизированного
копирования.

Правовые  меры  от  несанкционированного  автоматизированного  ко-

пирования. 

При посещении некоторых web-ресурсов и изучении их структуры

можно отметить, что владельцы размещают условия использования или пользо-
вательские соглашения. Указанные документы регулируют отношения между вла-
дельцами и пользователями web-ресурсов, фиксируют права, обязанности и ответ-
ственность сторон, а также правила использования ресурса и контента. В случае,
если в пользовательском соглашении имеется пункт, который запрещает автома-
тизированное копирование, то тот, кто осуществляет процесс парсинга нарушает
правила пользования данным ресурсом.

Для пользователей web-ресурсов не понятно подписано ли пользовательское

соглашение и необходимо ли это, если он планирует посетить сайт для чтения,
просмотра.

Следует учитывать, что большинство сайтов не привязаны к персональным

данным физического лица, что затрудняет идентификацию заключившего с вла-
дельцем web-ресурса пользовательское соглашение [5].

Существует различие между зарегистрированными и незарегистрированны-

ми пользователями ресурсов. Если парсинг осуществляется зарегистрированным
пользователем, который при регистрации подтвердил свое согласие с условиями
пользовательского соглашения, владелец сайта имеет право применить санкции,
предусмотренные в договоре. Простейшее наказание – это «бан», который юриди-
чески может означать введение ограничения действий пользователя или растор-
жение договора в одностороннем порядке [6].

Технические  меры  от  несанкционированного  автоматизированно-

го  копирования. 

Для предотвращения одной атаки со стороны программного

Специальные вопросы регулирования и охраны цифровых технологий

Special issues of regulation and protection of digital technologies

Специальные вопросы регулирования и охраны цифровых технологий

Special issues of regulation and protection of digital technologies

105

обеспечения парсера возможно применить несколько вариантов защиты, которые
при комплексном воздействии на атаку позволяют дать удовлетворительный ре-
зультат для владельца информации при защите его сведений.

Для эффективной защиты от атак вредоносного программного обеспечения

парсера можно применить несколько методов, которые вместе обеспечат надеж-
ную защиту информации. Один из таких методов активно используется в области
информационной безопасности – это применение ложной информации для запу-
тывания злоумышленника. Например, внедрение муляжей видеокамер или объ-
ектов инфраструктуры, которые будут вводить злоумышленника в заблуждение
и отвлекать его от реальных целей.

Для защиты WEB-пространства от парсинга также может быть использован

метод навязывания заведомо ложной информации злоумышленникам. Этот под-
ход заключается в том, что WEB-ресурс обнаруживает роботизированный трафик
и выводит измененную версию страницы для подозрительных пользователей [7].

Аналогичная стратегия применяется в приложении «Авито», где в объявле-

ниях не указывается достоверный номер телефона продавца или покупателя, но
при вызове осуществляется переадресация на правильный номер.

Предлагается расширить данный подход следующим образом:
1. Определить наличие вредоносных парсеров, осуществляющих автомати-

зированный сбор данных.

2. Создать фальшивые данные по запросу.
3. Передать эти фальшивые данные в ответ на запросы.
При этом необходимо учесть, что вывод фальшивых данных не должен по-

влиять на внешний вид страницы. Кроме того, желательно, чтобы страница была
изменена таким образом, чтобы законный пользователь все равно мог просматри-
вать оригинальный контент.

Давайте рассмотрим две ситуации, при которых происходит парсинг:
1. Злоумышленник использует поиск на сайте, и в результате ему предостав-

ляется список информации.

Когда пользователи проводят легальный поиск, результаты будут соответ-

ствовать их требованиям, а наиболее подходящая информация будет расположена
в начале списка. Однако, если поиск осуществляется вредоносным парсером, ре-
зультаты могут быть перемешаны, и строки, полностью соответствующие крите-
риям, могут быть опущены. Тем не менее, не исключая возможность получения
«ложного списка» легальным пользователем. В этом случае, с помощью анализа
правильных результатов, пользователь сможет легко выбрать наиболее подходя-
щую информацию для своего поиска.

2. Злоумышленник производит сканирование WEB-страниц по известным

ему адресам, с целью получения подробной информации об объектах – людях, то-
варах и т. д. При обнаружении вредоносной активности, на HTML-странице соз-
дается дополнительное поле, в которое сохраняется оригинальная информация.
При этом ложная информация выводится в поле, предназначенное для оригиналь-
ных данных. На рис. представлена схема анализа поведения пользователя.

Специальные вопросы регулирования и охраны цифровых технологий

Special issues of regulation and protection of digital technologies

Специальные вопросы регулирования и охраны цифровых технологий

Special issues of regulation and protection of digital technologies

106

Рис. Анализ поведения пользователя

Применение данного метода позволит компрометировать собранный парсе-

ром пакет информации.

Заключение.

Основными направлениями использования парсинга злоумыш-

ленником являются: автоматизированный сбор персональных данных пользова-
телей, информация об интеллектуальной собственности, финансово-значимый
контент.

В статье был проведен анализ нормативно-правовой базы Российской Феде-

рации по защите общедоступной информации и сделан вывод о допустимости
навязывания заведомо ложной информации в случае нарушения правил пользова-
тельского соглашения.

В рамках статьи были рассмотрены способы защиты от парсинга и предло-

жен усовершенствованный способ защиты от парсинга – навязывание злоумыш-
леннику заведомо ложной информации. Реализация данного метода позволит сде-
лать собранные данные непригодными для последующего использования.

Список литературы

1. «РТК-Солар»: мошенники пишут россиянам от имени правоохранителей.

URL: https://rt-solar.ru/events/news/3665

2. Конституция Российской Федерации (принята всенародным голосованием

12.12.1993). URL: https://www.consultant.ru/document/cons_doc_LAW_28399

Специальные вопросы регулирования и охраны цифровых технологий

Special issues of regulation and protection of digital technologies

Специальные вопросы регулирования и охраны цифровых технологий

Special issues of regulation and protection of digital technologies

107

3. Федеральный закон «Об информации, информационных технологиях и о за-

щите информации» от 27.07.2006 № 149-ФЗ. URL: https://www.consultant.ru/document/
cons_doc_LAW_61798

4. Уголовный кодекс Российской Федерации: федеральный закон от 13.06.1996

№ 63-ФЗ. URL: https://www.consultant.ru/document/cons_doc_LAW_10699

5. Демина Р. Ю., Ажмухамедов И. М. Защита web-контента от нелегитимного

роботизированного копирования // Вестник ГГНТУ. Технические науки. 2022. Т. 18,
№ 1. С. 3-4.

6. Демин К. С., Марьенков А. Н. Обнаружение и противодействие вредоносным

веб роботам // Проблемы повышения эффективности научной работы в оборон-
но-промышленном комплексе России: Материалы IV Всероссийской научно-прак-
тической конференции. Астраханский государственный университет. Астрахань,
2021. C. 121–127.

7. Демина Р. Ю., Ажмухамедов И. М. Защита web-контента от нелегитимного

роботизированного копирования // Вестник ГГНТУ. Технические науки. 2022. Т. 18,
№ 1. С. 11–17.

Р. Д. Мартинс,

кандидат юридических наук,

частнопрактикующий адвокат в Бразилии

(OAB/RN 15.923)

ЗАЩИТА АВТОРСКИХ ПРАВ В УСЛОВИЯХ ЦИФРОВИЗАЦИИ:  

О НЕПРОЗРАЧНОСТИ АЛГОРИТМОВ ПОСРЕДНИКОВ

Аннотация.

Целью исследования является выявление возникающих у автора

сложностей в сфере защиты своих авторских прав в условиях цифровизации из-за
непрозрачности алгоритмов посредников, таких как «Amazon», «ЛитРес», осо-
бенно когда речь идет о чтении книги, взятой у посредника по подписке. Это об-
условлено главным образом тем, что у автора практически нет возможности даже
установить факт нарушения. Как алгоритмы рассчитывают количество прочитан-
ных страниц и на основании чего решают, сколько получит автор. Эти проблемы
требуют немедленного урегулирования, так как без полноценной прозрачности
появляется возможность замаскированного пиратства со стороны посредника.

Ключевые слова

: алгоритмы, авторское право, цифровизация, датаизм, от-

крытый исходный код, экономика подписок, непрозрачность алгоритмов

COPYRIGHT PROTECTION UNDER  

THE CONTEXT OF DIGITALIZATION: ON THE OPACITY  

OF THE ALGORITHMS OF INTERMEDIARIES

Abstract.

The purpose of the study is to identify the difficulties for the author

to protect their copyrights in the context of digitalization, due to the opacity of intermediary
algorithms, such as Amazon, Litres, especially when it comes to reading books taken from

Legal framework for protecting web resources   from harmful parsing

Abstract

Downloads

Keywords:

Abstract

References

Legal framework for protecting web resources from harmful parsing

Abstract

Downloads

Keywords:

Abstract

References

Legal framework for protecting web resources   from harmful parsing