Открытые данные
Работа с открытыми данными: особенности публикации и использования в правовом поле
Дискуссионный доклад
Доклад предназначен для всех публикаторов и пользователей открытых данных и ориентирован на практическое использование в работе для облегчения подготовки и использования наборов данных без нарушения существующих норм, а также распространения лучших практик в этой области.
От авторов
Сегодня феномен открытых данных стал широко распространен, и рассматривается как один из аспектов не только в контексте развития прозрачности государства – в связи с чем чаще всего и употребляется это понятие, – но и в целом важное подспорье развитию. Открытые данные позволяют улучшать транспортную инфраструктуру, строить новые информационные сервисы, развивать туризм и решать социальные проблемы.

Всплеск интереса к этой тематике подстегивает и развитие технологий искусственного интеллекта: для того, чтобы использовать машинное обучение, необходимы обучающие выборки, данные для которых в идеале должны быть общедоступными для того, чтобы можно было получить сравнимость и верифицируемость результатов различных решений. При этом уже сегодня на использование открытых данных нацелены такие инициативы, как World AI&Data Challenge – конкурс, привлекающий к решению социальных задач широкий круг ИТ-специалистов.
Открытые данные – это общедоступная информация, размещенная в Интернете для неоднократного, свободного и бесплатного использования в виде машиночитаемых систематизированных данных, в формате, позволяющем их автоматизированную обработку.
При этом мы еще далеки от того, чтобы можно было говорить о сформированной культуре публикации и использования открытых данных, но мир в целом и Россия двигаются к этому. Важным шагом стало начало работы по публикации открытых данных со стороны государства и появление соответствующего пласта нормативных актов и специализированных ресурсов. Хотя эту деятельность сложно назвать в полной мере успешной (Подробнее смотрите «Доклад по открытости государства в России в 2019 году») , но она дала важный толчок для развития направления и его восприятия в обществе.

Как отмечают различные эксперты, во многом ограничивающими факторами более активной публикации открытых данных являются сегодня сдерживает публикацию открытых данных наряду со слабо развитой культурой открытости, является отсутствие знаний по основным техническим аспектам и, еще в большей степени – по правовым.
В этом докладе мы постарались отразить имеющуюся регуляторную ситуацию и основные сложившиеся практики публикации открытых данных с целью запуска экспертной дискуссии по развитию этой области.
Публикация открытых данных в России: что надо знать
Онлайн-семинар, на котором эксперты из разных профессиональных областей обсуждают развитие открытых данных в России. Как выстроить культуру публикации открытых данных? Каким техническим и юридическим нормам должны соответствовать подготовленные для публикации открытые данные? Семинар прошел в рамках подготовки методических рекомендаций для российских публикаторов. Участники:
  • Иван Бегтин, АНО «Информационная культура»
  • Тимур Алейников, независимый эксперт по инфраструктуре обработки данных, ex-куратор цифровых проектов Минкультуры России
  • Максим Дубинин, NextGIS
  • Дмитрий Семячкин, Киберленинка
  • Иван Засурский, Ассоциация интернет–издателей
  • Григорий Добромелов, директор Института прикладных политических исследований
Модерирует Василий Буров, АНО «Информационная культура»
Запись семинара
Введение в открытые данные
Открытые данные (англ. open data) — концепция, отражающая идею о том, что определённые данные должны быть свободно доступны для машиночитаемого использования и дальнейшей повторной публикации без ограничений авторского права, патентов и других механизмов контроля.

За последние годы открытые данные превратились в одно из ключевых направлений обеспечения открытости государства, прозрачности корпораций и доступности результатов научных исследований для их воспроизводимости. Открытые данные необходимы для разработки систем искусственного интеллекта, для которых они являются «бесплатным топливом», без которого невозможно обучение алгоритмов на, по-настоящему, больших объёмах данных и реальных задачах.

Открытость государственных данных как ключевой компонент открытости государства и как безусловная ценность проистекает из того, что именно открытость и транспарентность органов власти снижает дистанцию между ними и рядовыми гражданами. В этом процессе ключевую роль играют открытые данные, они дают возможность не просто обеспечить прозрачность принятия решения и определенных направления государственной политики, но и позволяют привлечь НКО и активные группы граждан к созданию гражданских проектов, помогающих в этой работе.

Правительства по всему миру предпринимают существенные усилия в публикации открытых данных, собираемых в государственных информационных системах – и в этом смысле Россия полноценный участник этого процесса, хотя и отстающий по многим параметрам. Но несмотря на выпадение в настоящее время повестки открытости из фокуса власти, это направление продолжает развиваться. В частности, это предполагает работу по следующим направлениям:
  • Кооперация с потребителями данных в выработке общих требований к раскрытию и обмену данными.
  • Максимальное проактивное раскрытие информации, которой располагает государство:
    для граждан – основных потребителей и бенефициаров этой информации. Здесь речь идет прежде всего о разговоре с обществом на понятном языке, предоставление информации в понятном для граждан виде;
    для экспертов и активистов гражданского общества как для помощников и союзников власти в борьбе с неэффективностью государства в целом и с неэффективной тратой бюджетных средств и коррупцией – здесь речь идет в том числе о предоставлении данных в машиночитаемом виде, чтобы и у власти, и у общества была возможность использовать новейшие технологии для автоматического поиска проблемных точек и их устранения.

    • Кооперация с ФОИВами и другими органами власти в повышении их подотчетности гражданам и снижения дистанции до власти для рядового гражданина.

    При этом работа с данными внутри государства и, как следствие, открытость данных имеет ряд проблем и противоречий:
    1
    Технологии. Довольно большой массив данных уже открыт, но представлен в виде, который затрудняет анализ и сопоставление данных, в том числе использование алгоритмов для анализа.
    2
    Стандарты. Отсутствие уважаемого и весомого координатора открытости, который мог бы задавать стандарты открытости, убеждать ведомства открываться по единым форматам. Наличие единого ЦОД, который позволял бы подключать взаимосвязи между всеми данными разных систем.
    3
    Компетенции. Низкий уровень цифровых компетенций госслужащих, не позволяющий им раскрывать данные в удобном и понятном виде.
    4
    Противодействие. Наличие мощных стейкхолдеров, не заинтересованных в раскрытии некоторой информации, в основном связанными с ведомственными и личными интересами.
    5
    Спецрежимы. Большое количество данных имеют гриф, содержат коммерческую тайну или личные данные. Часто это используется для закрытия информации.
    6
    Достоверность данных. Значительная часть содержащихся в открытом доступе данных не являются достоверными.
    Системная скоординированная работа по установлению новых стандартов и внедрению технологических решений, наращиванию компетенций госслужащих и преодолению инерции и противодействия привыкших к закрытости ведомств позволит обеспечить высокую доступность данных в случае восстановления повестки открытости в деятельности российского правительства.
    Примеры проектов на основе госданных
    • Университетская информационная система Россия (УИС Россия). Агрегатор официальной государственной статистики – https://uisrussia.msu.ru/
    • Открытые НКО. Агрегатор сведений о некоммерческих организациях – https://openngo.ru/
    • Госзатраты. Агрегатор сведений о госфинансах – https://clearspending.ru
    • Декларатор. Агрегатор сведений о декларациях официальных лиц – https://declarator.org
    • Российские школы. Агрегатор сведений о российских школах – https://russianschools.ru
    Помимо государственных открытых данных заметным является и сектор общественных открытых данных. Наборы данных в нем могут быть собраны самими разными субъектами – от учёных до межправительственных организаций.
    Примеры общественных открытых данных
    • Экосистема Фонда Викимедия – DBPedia , WikiData , Wikipedia
    • Порталы научных данных, хорошим поисковым ресурсом по репозиториям которых является проект https://www.re3data.org/
    • Хаб открытых данных от OKF и Datopian – https://datahub.io/
    • Агрегатор данных Data.world – https://data.world/
    • Проект Dataverse Гарвардского университета – https://dataverse.harvard.edu/
    • Портал раскрытия научных данных ЕС Zenodo – https://zenodo.org
    • Наборы открытых данных на платформе Azure – https://azure.microsoft.com/en-us/services/open-datasets/
    • Порталы данных межгосударственных структур: Всемирный банк, ООН, ВОЗ и др
    Обращает на себя внимание то, что с российскими примерами в этой области дело обстоит заметно хуже. Как пример можно привести Портал открытых данных НКО http://www.ngodata.ru/, но он пока он довольно слабо наполнен: некоммерческие организации предпочитают генерируемые в рамках своих проектов данные оставлять себе, либо вообще не осознавая их значимости, либо считая собственным активом. Редким примером научных открытых данных в России является Национальный корпус русского языка https://ruscorpora.ru/.

    Постепенно круг таких проектов расширяется. Дополнительным стимулом к этому стало развитие технологий машинного обучения, подчеркнувшее важную инфраструктурную роль наличия общедоступных наборов данных. Однако в России этот процесс развивается достаточно медленно, виной чему является как недостаток культуры открытости, так и отсутствие отработанных механизмов и традиций общественного финансирования – а поддержание проектов публикации открытых данных требует определенных затрат.

    Основные принципы и стандарты в области открытых данных
    Правовое поле открытых данных
    Правовое поле открытых данных определяется тремя основными направлениями:

    1. Нормативная база, обеспечивающая публикацию открытых данных государством. Помимо очевидного аспекта обеспечения подконтрольности и прозрачности государственного управления, это критически важный аспект распространения культуры открытых данных в обществе – особенно в условиях государственно-центричной ситуации в России. Закрепленная обязанность государственных органов публиковать такие данные и появление различных коммерческих и общественных проектов, базирующихся на них, создает важные прецеденты и позволяет отработать необходимые практики.

    2. Правовые вопросы, связанные с самими публикуемыми данными. Важнейшим аспектом тут является регулирование публикации чувствительных данных и, в первую очередь, соблюдение прав приватность для граждан. К этому же направлению относится обеспечение коммерческой тайны, авторских прав и т.д.

    3. Лицензии, регламентирующие использование данных – и определяющих правовые отношения пользователя данных и их публикатора.
    Государственные открытые данные
    Эффективность размещения открытых данных зависит от развития их нормативно-правового обеспечения. В настоящее время к ним есть разные типы доступа: полностью свободный (можно получить данные без регистрации на портале), частично свободный (можно получить данные после регистрации на портале), полностью закрытый (касается персональных данных, государственной тайны). В зависимости от этого есть различные документы, регулирующие данную сферу:
    • Федеральный закон от 27 июля 2006 г. №149-ФЗ «Об информации, информационных технологиях и о защите информации»;
    • Федеральный закон от 9 февраля 2009 г. №8-ФЗ «Об обеспечении доступа к информации о деятельности государственных органов и органов местного самоуправления»;
    • Федеральный закон от 7 июня 2013 г. №112-ФЗ «О внесении изменений в Федеральный закон «Об информации, информационных технологиях и о защите информации» и Федеральный закон «Об обеспечении доступа к информации о деятельности государственных органов и органов местного самоуправления»;
    • Постановление Правительства Российской Федерации от 24 ноября 2009 г. №953 «Об обеспечении доступа к информации о деятельности Правительства Российской Федерации и федеральных органов исполнительной власти»;
    • Постановление Правительства Российской Федерации от 10 июля 2013 г. №583 «Об обеспечении доступа к общедоступной информации о деятельности государственных органов и органов местного самоуправления в информационно-телекоммуникационной сети «Интернет» в форме открытых данных»;
    • Распоряжение Правительства Российской Федерации от 10 июля 2013 г. №1187-р «О перечнях информации о деятельности государственных органов, органов местного самоуправления, размещаемой в сети «Интернет» в форме открытых данных»;
    • Распоряжение Правительства Российской Федерации от 30 января 2014 г. №93-р «Об утверждении Концепции открытости федеральных органов исполнительной власти»;
    • Приказ Минкомсвязи России от 27 июня 2013 г. №149 «Об утверждении Требований к технологическим, программным и лингвистическим средствам, необходимым для размещения информации государственными органами и органами местного самоуправления в сети «Интернет» в форме открытых данных, а также для обеспечения ее использования»;
    • Закон РФ № 5485-1 от 21.07.1993 «О государственной тайне»;
    • Федеральный закон от 27.07.2006 N 152-ФЗ (ред. от 21.07.2014) «О персональных данных» (с изм. и доп., вступ. в силу с 01.09.2015).
    Также, помимо нормативно-правовых актов, большое значение имеют установленные правительством планы, направленные на совершенствование системы:

    • планы открытости;
    • планы информатизации;
    • планы развития официальных сайтов;
    • планы мероприятий отдельных программ и ведомст

    Принципы открытости сформулированы в данных документах. Они определяют необходимые условия достижения поставленных целей от открытости данных, таких как: повышение прозрачности государства, поддержка бизнеса, вовлечение граждан в участие в государственном управлении. Эти семь принципов сформулированы следующим образом: полнота, первичность, своевременность, открытость и доступность, пригодность к машинной обработке, свобода поиска, получения и распространения информации, соблюдение прав граждан и организаций

    Регулярное соблюдение этих условий позволит в полной мере использовать предоставляемую информацию для улучшения как социального, так и экономического климата страны. Несмотря на достаточно широкую нормативную базу, некоторые пункты нуждаются в совершенствовании и дополнении. Это важно для увеличения органов, публикующих открытые данные в необходимом количестве и формате, а также стандартизации, позволяющей сформировать этот «необходимый формат».

    Отчасти эта работа была проделана за время существования «Открытого правительства» когда органы власти получили обязанность публикации планов открытости, планов деятельности и раскрытия открытых данных на официальных сайтах. Однако с 2018 года, после ликвидации «Открытого правительства» контроль за соблюдением требований и рекомендаций по открытости прекратился и вопросы открытости отошли на второй план, а на первый план вышли инициативы по цифровизации государственного управления.

    При этом, помимо международных признанных ключевых направлений юридического обеспечения открытости данных, особенность публикации открытых данных в России в том, что наибольшие данных, по объёму и по значению, накапливаются в государственных информационных системах. В докладе «Оценка открытости государственных информационных систем 2020 г» приведены примеры таких систем и оценена их текущая открытость. Из доклада можно узнать, что текущее государственное регулирование не обеспечивает открытости данных в государственных информационных системах по умолчанию. Таких требований нет ни в конкурсной документации на разработку информационных систем, ни в методических рекомендациях, ни в типовых положениях для информационных систем.

    Другими важными направлениями являются, «открытость по умолчанию» (open by default) и внедрение открытых данных в существующее регулирование. Такие требования отсутствуют в текущем российском регулирование и, как следствие, в большинстве случаев создания государственных информационных систем недоступными остаются большая часть хранимых в них данных.
    Открытые данные и искусственный интеллект
    Открытые данные – это важнейший компонент многих общедоступных работ, связанных с искусственным интеллектом. Например, без открытости наборов данных, были бы значительно ограничены возможности платформы Kaggle предоставляющей доступ к большому числу наборов данных для машинного обучения и регулярно организующей конкурсы по машинному обучению.

    В Европейском союзе проходит мониторинг использования открытых данных для систем ИИ, а международная НКО Web Foundation проводит исследования по использованию открытых данных в ИИ и моральных и этических ограничениях в применении новых технологий.

    Российская Национальная стратегия развития искусственного интеллекта на период до 2030 года включает положения о необходимости обеспечения доступности данных, в пункте V. Цели и основные задачи развития искусственного интеллекта указано в пункте 24:

    в) повышение доступности и качества данных, необходимых для развития технологий искусственного интеллекта;

    А также в пунктах 37 и 38:

    37. Основными факторами развития технологий искусственного интеллекта являются увеличение объема доступных данных, в том числе данных, прошедших разметку и структурирование, и развитие информационно-коммуникационной инфраструктуры для обеспечения доступа к наборам таких данных.

    38. Основными направлениями повышения доступности и качества данных, необходимых для развития технологий искусственного интеллекта, в соответствии с требованиями законодательства Российской Федерации являются:

    а) разработка унифицированных и обновляемых методологий описания, сбора и разметки данных, а также механизма контроля за соблюдением указанных методологий;

    б) создание и развитие информационно-коммуникационной инфраструктуры для обеспечения доступа к наборам данных посредством:

    - создания (модернизации) общедоступных платформ для хранения наборов данных, соответствующих методологиям описания, сбора и разметки данных;

    - хранения наборов данных (в том числе звуковых, речевых, медицинских, метеорологических, промышленных данных и данных систем видеонаблюдения) на общедоступных платформах для обеспечения потребностей организаций - разработчиков в области искусственного интеллекта;

    - установления приоритетного доступа российских государственных органов и организаций к общедоступным платформам.

    Здесь необходимо отметить что отсутствие единой нормативной терминологии мешает употреблению определения «открытые данные» напрямую, а сама национальная стратегия развития искусственного интеллекта разрабатывалась и принималась в отсутствие национальной стратегии работы с данными, создание которой, безусловно необходимо чтобы закрыть пробелы в нормативном регулировании в этой области.

    Запущенный в настоящее время московский регуляторный эксперимент по развитию технологий искусственного интеллекта, потребовавший принятие специального федерального закона. В его рамках с 1 июля 2020 года сроком на 5 лет предусматривается введение специального правового режима «в целях создания необходимых условий для разработки и внедрения технологий ИИ, а также последующего использования результатов его применения». Одним из важных моментов в нем является возможность установления московским правительством по согласованию с Роскомнадзором специальных – более облегченных – условий по обработке обезличенных персональных данных. Но пока рано говорить о том, что именно будет происходить: никаких нормативных актов Правительства Москвы, определяющих уже конкретику реализации, на момент подготовки этого документа не появилось.
    Чувствительная информация
    Развитие информационных технологий показало, что информация и данные имеют высокий потенциал для их монетизации. Аналитика данных посетителей приложений и сайтов, пользователей всяческих клиентских сервисов стала основой для множества успешных бизнесов и коммерческих продуктов. Такие проекты созданы и в государственной, некоммерческой сфере.

    Злоупотребления при создании таких проектов, несомненно, могут представлять опасность для граждан. Ситуация осложняется тем, что в России на сегодняшний день у граждан довольно мало эффективных механизмов защиты от недобросовестного использования их персональных данных и других данных, имеющих отношение к частной жизни. Всем известные примеры злоупотребления – различные реестры и базы данных, продающиеся на «черном рынке», которые позволяют получить доступ практически к любой информации о человеке.

    Кроме того, потенциалом к недобросовестному использованию данных обладает и так называемый «цифровой след» – набор действий и данных, оставленных пользователем после использования приложения, ПО или посещения сайта, аналитика которых позволяет получить о нем дополнительную информацию.

    Распространение всех перечисленных практик влечет многочисленные случаи нарушения приватности и неприкосновенности частной жизни людей, и, с учетом потенциала монетизации таких данных, создает благоприятные условия для их использования в криминальных и мошеннических целях. Усложнение и распространение методов социальной инженерии в мошеннических целях с использованием данных, например, данных о клиентах банков – также результат злоупотребления доступами к данным.

    В целом, несмотря на достаточно трудное для понимание – и ориентированное на классическое, а не цифровое распространение информации – законодательство в области персональных данных можно в отношении применимости к сфере открытых данных представить в виде достаточно простой схемы.
    Помимо персональных данных, существуют и другие виды конфиденциальной информации, использование которой при сборе с целью дальнейшей публикации наборов открытых данных может стать препятствием из-за существующего режима защиты такой информации.

    Ограничение доступа к информации производится на основании федеральных законов, при этом соблюдение конфиденциальности такой информации является обязательным. Единого актуального перечня видов информации с ограниченным доступом не существует. К основным видам информации с ограниченным доступом относится государственная тайна и конфиденциальная информация, последняя разделяется на коммерческую тайну, служебную тайну, личную и семейную тайну, персональные данные, профессиональные тайны (адвокатская, аудиторская, банковская, журналистская, медицинская, страховая и др.), тайну следствия и судопроизводства, тайну связи.
    Влияние внутреннего и международного регулирования публикации данных
    В целом российская нормативная база, затрагивающая публикацию данных, достаточно хорошо сочетается с международной и каких-то специальных адаптаций не требуется. Пожалуй, главным исключением является европейское законодательство, традиционно сфокусированное на защите прав личности – в том числе и в цифровом пространстве.
    General Data Protection Regulation (GDPR)
    расширенный европейский аналог российского законодательства о защите личных данных - дает более подробное и ясное определение. Положения данного Регламента носят трансграничный характер. ЕС распространяет его действие на организации, предоставляющие сервис, товары или услуги потребителям Европейского Союза. При этом не важно, где зарегистрирована компания - в ЕС или за его пределами, в том числе и на территории Российской Федерации. Согласно этому Регламенту, понятие «личные данные» означает любую информацию, относящуюся к идентифицированному или идентифицируемому физическому лицу («субъект данных»); Идентифицируемое физическое лицо — это лицо, которое может быть идентифицировано прямо или косвенно, в частности, посредством ссылки на идентификатор, такой как имя, идентификационный номер, данные о местоположении, онлайновый идентификатор или один или несколько факторов, специфичных для физического, физиологического, генетической, умственной, экономической, культурной или социальной идентичности этого физического лица.
    Чтобы не вводить читателя в заблуждение относительно того, следует ли ему при работе с данными учитывать обширные требования GDPR, достаточно выяснить, распространяются ли в отношении вашей компании или компании, которая является для вас источником данных, действие Регламента GDPR.

    Скорее всего, Регламент будет применим, если можно положительно ответить хотя бы на один из следующих вопросов:
    • Заключает ли компания договоры, регулирующие обработку данных, например, Стандартные договорные условия (Standard Contractual Clauses) с компаниями из ЕС?
    • Ведет ли компания обработку данных, либо получает ли компания доступ к базам данных по соглашениям с компаниями из ЕС (партнерами или клиентами)?
    • Доступна ли версия вашего корпоративного сайта на одном из европейских языков (английском, немецком, французском, чешском и т. д.)?
    • Осуществляете ли вы сбор персональных данных на сайте (ведется ли регистрация пользователей, используются ли формы для предоставления обратной связи и т. п.)?
    • Предлагает ли компания товары или услуги физическим лицам на территории ЕС (например, осуществляет доставку товаров из РФ в ЕС, предлагаете информационные услуги, в том числе через посредников)?
    • Имеет ли компания (группа компаний) филиалы, представительства или дочерние компании, зарегистрированные в ЕС?
    Лицензии
    Лицензия – это договор, по которому правообладатель произведения (лицензиар) предоставляет другой стороне (лицензиату) право использования произведения в установленных договором пределах. Применительно к данным – это правила, определяющие то, как именно в дальнейшем смогут использоваться опубликованные вами материалы.

    Все лицензии можно разделить на коммерческие (несвободные) и некоммерческие (свободные). Первый тип лицензий используется с целью заработать на своем информационном продукте деньги, а второй – с целью дать другим возможность безвозмездно использовать ваши данные. Соответственно, публикация открытых данных требует использование лицензий, которые обеспечат правовую основу этой открытости.

    Свободные лицензии — лицензии с разрешением использовать произведение в любых целях, изучать его, создавать и распространять копии произведения, вносить в произведение изменения, публиковать и распространять такие изменённые производные произведения. Самый широкий вариант свободной лицензии – открытая лицензия. Она дает максимально широкие права на использование данных и документов, в том числе право на бесплатное повторное использование, переработку и распространение. Лицензии, требующие при повторной публикации ссылки на источник или указания авторства, обычно тоже относят к открытым. Лицензии, которые добавляют к этому запрет на коммерческое использование, к открытым не относятся.

    Некоммерческие лицензии условно также можно разделить на два вида: открытые и свободные. Несмотря на, казалось бы, схожие названия, эти лицензии действуют по разным принципам. Основное их различие состоит как раз в правах на создание производных произведений (в нашем случае это набор открытых данных, или, по российскому законодательству, база данных).

    Статья 1286.1 ГК РФ, регулирующая открытые лицензии, говорит об этом достаточно пространно: «лицензиар может предоставить лицензиату право на использование принадлежащего ему произведения для создания нового результата интеллектуальной деятельности. В данном случае, если иное не предусмотрено открытой лицензией, считается, что лицензиар сделал предложение заключить договор об использовании принадлежащего ему произведения любым лицам, желающим использовать новый результат интеллектуальной деятельности, созданный лицензиатом на основе этого произведения, в пределах и на условиях, которые предусмотрены открытой лицензией. Акцепт такого предложения считается также акцептом предложения лицензиара заключить лицензионный договор в отношении этого произведения».

    В предложенной законом процедуре не совсем ясно, как лицензиар, то есть автор или владелец набора данных сможет узнать, какие производные произведения были созданы с использованием его набора данных. То есть для автора будет затруднительно понять с кем у него заключены лицензионные договоры. Более понятным представляется механизм свободных лицензий, в которых механизм создания производных произведений, а также другие способы использования прав на произведение четко структурированы.

    Плюсом использования открытой лицензии является более сформированная судебная практика ее защиты. То есть, при обращении в суд защитить свою позицию будет легче.

    Применение свободных лицензий предполагает, что одна сторона договора определяет условия в стандартной форме, а другая присоединяется к этому договору не иначе как с принятием правил всего договора в целом.
    Существует два основных типа свободных лицензий: вирусные и пермиссивные.

    Пермиссивные, например лицензия BSD (Berkeley Software Distribution license), изначально были написаны для программного обеспечения. Суть этих лицензий заключается в следующем: объект можно использовать как угодно (в том числе, как составную часть коммерческого продукта), но необходимо указывать автора оригинального произведения. Такой тип лицензии не накладывает никаких других ограничений.

    Вирусные лицензии, придуманные Ричардом Столлманом. Альтернативное название — «копилефт-лицензии» (copyleft license). У таких лицензий есть отличительная черта: если берется произведение, которое распространяется по такой лицензии, то все производные от него тоже должны распространяться по той же лицензии. Если, например, используется часть кода под такой лицензией в программе, то и программа в целом должна распространяться на условиях этой свободной лицензии.

    В случае, если все эти условия не соблюдены, правообладатель может предъявить недобросовестному пользователю претензию о незаконном использовании интеллектуальной собственности.

    Фактически описанные подходы базируется в первую очередь на международной практике, но российское законодательство в этой части позволяет в прямую использовать эти подходы. Единственное, что приходится учитывать – это то, что правоприменительная практика развита слабо, а у судов и следственных органов отсутствуют необходимые компетенции и опыт, чтобы эффективно работать в данной сфере.

    Для непрограммного контента (тексты, фотографии, музыка, видео и т. п.), к которому относятся и данные, чаще всего в мире используются лицензии семейства Creative Commons. Постепенно это становится хорошей практикой и в России. Такая стандартизация позволяет практически «автоматом» решать вопрос с подготовкой лицензии при публикации данных. Однако многочисленность семейства таких лицензий требует понять, какую «широту» использования она может предоставить в отношении тех или иных данных. Например, лицензия CC BY-SA подразумевает, что все производные вашего произведения должны распространяться также свободно, как и исходное. Лицензия CC BY требует только атрибуцию, что означает, что производное вашего произведения может распространяться под любой другой лицензией. Лицензия CC BY-NC предполагает, что произведение используется исключительно в некоммерческих целях, а CC BY-NC-ND – самая несвободная из всех лицензий – что произведение можно только скачивать и распространять, внесение изменений или использование в коммерческих целях запрещено. При этом стоит отметить, что если набор данных не является общественным достоянием или не связан с лицензией, дающей право на свободное повторное использование, то такой набор данных нельзя считать открытым, даже если он выложен в машиночитаемом виде в сеть. Выбрать подходящую лицензию из группы Creative Commons можно на сайте.

    Отметим, что если организация публикует несколько типов контента, не соотносящихся друг с другом, то, скорее всего, на каждый из них необходимо будет определить свой тип лицензии. Это связано с тем, что некоторые лицензии не могут использоваться для разных типов контента. Например, лицензии CC не подходят для публикации ПО: «они не содержат конкретных условий распространения исходного кода, что может быть достаточно важно для обеспечения бесплатного повторного использования и модификации программного обеспечения. В свою очередь, многие лицензии на программное обеспечение также затрагивают патентные права, которые не могут быть применимы к другим работам, защищенным авторским правом». В большей степени это касается CC-BY-4.0 и CC-BY-SA-4.0.

    При выборе лицензии из группы Creative Commons нужно помнить о том, что не все они подходят для публикации открытых данных, поскольку часть подразумевает ограничения в области изменений начального произведения. Наиболее «ходовые» лицензии – Attribution и ShareAlike. Лицензия CCBY – самая свободная из группы лицензий Creative Commons. Она позволяет другим распространять, редактировать, поправлять и брать за основу ваше произведение до тех пор, пока они указывают ваше авторство. Рекомендуется для максимального распространения и использования лицензированных материалов. Лицензия CCBY-SA подразумевает, что все произведения, созданные на основе вашего, будут опубликованы под этой же лицензией. Она позволяет другим редактировать, поправлять и брать за основу ваше произведение даже в коммерческих целях до тех пор, пока они указывают ваше авторство и лицензируют свои творения на идентичных условиях.
    Лицензия CC BY-ND (Creative Commons Attribution-NoDerivs)
    Лицензия «С указанием авторства — Без производных». Эта лицензия позволяет свободно распространять произведение, как на коммерческой, так и некоммерческой основе, при этом работа должна оставаться неизменной и обязательно должно указываться авторство. Данная лицензия запрещает перевод произведения на другой язык.
    Лицензия CC BY-NC (Creative Commons Attribution-NonCommercial)
    Лицензия «С указанием авторства — Некоммерческая». Эта лицензия позволяет другим перерабатывать, исправлять и развивать произведение на некоммерческой основе, и хотя для производных работ сохраняются требования указания авторов и некоммерческого использования, не требуется предоставления третьим лицам аналогичных прав на производные от неё.
    Лицензия CC BY-NC-SA (Creative Commons Attribution-NonCommercial-ShareAlike)
    Лицензия «С указанием авторства — Некоммерческая — С сохранением условий». Эта лицензия позволяет другим перерабатывать, исправлять и развивать произведение на некоммерческой основе до тех пор, пока они упоминают оригинальное авторство и лицензируют производные работы на аналогичных лицензионных условиях. Пользователи могут не только получать и распространять произведение на условиях, идентичных данной лицензии («by-nc-sa»), но и переводить, создавать иные производные работы, основанные на этом произведении. Все новые произведения будут иметь одни и те же лицензии, поэтому все производные работы также будут носить некоммерческий характер
    Лицензия CC BY-NC-ND (Creative Commons Attribution-NonCommercial-NoDerivs)
    Лицензия «С указанием авторства — Некоммерческая — Без производных». Данная лицензия имеет наибольшие ограничения среди шести основных лицензий, разрешающих свободное распространение произведения. Эту лицензию часто называют лицензией «бесплатной рекламы», поскольку она позволяет другим получать и распространять произведение до тех пор, пока они упоминают автора и ссылаются на него, но они не могут ни под каким видом изменять произведение и использовать его в коммерческих целях.
    Механизм использования открытых лицензий также доступно описан в статье Sara F. Hawkins «Creative CommonsLicensesExplainedInPlainEnglish». Автор указывает читателю на то, что любая из лицензий Creative Commons требует указания ряда обязательных атрибутов, а именно:
    • имени автора произведения (а также соавторов и пр.);
    • правового статуса произведения;
    • лицензии, на условиях которой используется материал;
    • дисклеймера об условиях использования;
    • ссылки на первоисточник.
    В случае, если все эти условия не соблюдены, правообладатель может предъявить недобросовестному пользователю претензию о незаконном использовании интеллектуальной собственности.

    Больше всего для публикации открытых данных подходят лицензии CCBY, CCBY-SAи СС0.

    После того, как вы определились с выбором лицензии, ее необходимо будет указать в паспорте набора открытых данных, проставив ссылку на текст лицензии. Естественно, что при публикации в России желательно, чтобы текст был представлен на русском языке, поскольку это позволит пользователям лучше разобраться в существующих ограничениях и условиях использования.
    Практика работы с открытыми данными
    Публикация открытых данных
    Публикация открытых данных с самого начала практически всегда осуществлялась через специальные порталы открытых данных, официальные сайты организаций и, реже, через унаследованные интерфейсы доступа к данным, например, FTP сервера.

    В разных инструментах, при этом, были предусмотрены разные стандарты публикации метаданных о наборах данных. Где-то использовались стандарты Dublin Core, применяемые и для любых иных цифровых объектов, где-то расширенные стандарты описания, базирующиеся на принципах открытых данных используемых Open Data Charter, где-то на основе других практик и правил.

    Важная особенность изменений в последние годы в том, что порталы открытых данных перестали быть чем-то новым и прорывным. Порталы открытых данных, в основном, основаны на нескольких решениях: CKAN, DKAN, OpenDataSoft, Dataverse и они как выполняли, так и выполняют ключевую функцию доставки данных конечным пользователям. Иногда может показаться, а что же ещё может в них появиться? Главное, что может появиться — это новые сервисы доставки данных без порталов. Это сервисы управления пакетами данных очень похожих на системы контроля версий или системы управления пакетами ПО в Unix.

    К подобным сервисам можно отнести такой проект DataHub.io созданный компанией Datopian совместно с Open Knowledge Foundation, а также многочисленные другие проекты.

    Эти проекты отражают зрелость сообщества открытых данных в использовании данных и потребности в повышении качества их использования. В Приложении

    В Российских порталах открытых данных, как общественных, так и государственных, пока такие инструменты не используются, но это лишь вопрос времени, когда такие инициативы будут возникать от коммерческого сектора и в некоммерческих организациях.

    Ещё одним важным отличием публикации данных в России от аналогичных порталов и проектов по публикации в мире – это существенный практический разрыв между академическими проектами по публикации данных, государственными и общественными. Практически все опубликованные и публикуемые данными на официальных государственных порталах – это административные данные, не охватывающие исследовательские работы. И, в то же время, общественные/некоммерческие проекты практически не пересекаются с академическими проектами раскрытия данных.

    Итоговое сообщество людей/организаций/проектов рассеяно именно по причине малого пересечения между академическими, некоммерческими и государственными публикаторами (и потребителями данных). Нужны существенные усилия по организации просвещения этих групп для дальнейшего объединения их усилий.

    Публикация данных может оказаться трудоёмким процессом, отличающимся, в зависимости от задач и объёмов данных. Ряд рекомендаций может значительно упростить процесс публикации и помочь пользователям, как публикующим, так и потребляющим данные:
    1. Предоставление программного интерфейса к каталогу данных и к API.
    2. Обязательное наличие инструкций и рекомендаций по публикации данных.
    3. Сбор обратной связи от пользователей.
    4. Публикация глоссария для самых неподготовленных пользователей.
    5. Использование свободных лицензий, включая разъяснение пользователям их особенностей.
    6. Удобный полнотекстовый поиск по данным.
    7. Интерфейсы табличного и картографического отображения.
    8. Использование стандартных форматов публикации (XML, CSV, JSON).
    Анонимизация данных
    Анонимизацию данных можно считать одним из способов защиты данных и содержащейся в них информации. Особенно это актуально для чувствительных категорий данных, например, для персональных данных.

    Российское законодательство не содержит понятия анонимизации персональных данных, однако регулирует обезличивание данных.

    Под обезличиванием персональных данных понимается один из способов обработки персональных данных, в результате которого становится невозможно без использования дополнительной информации определить принадлежность персональных данных конкретному субъекту.

    Пример использования обезличивания при публикации открытых данных – публикация судебных решений,

    Требования и методы обезличивания персональных данных утверждены приказом Роскомнадзора от 5 сентября 2013 года № 996. Так как это единственный источник, фактически Роскомнадзор применяет перечисленные в нем требования к частным компаниям, хотя де-юре приказ написан для государственных и муниципальных органов.

    В приказе перечислены следующие методы обезличивания:
    • введение идентификаторов (замена части сведений, составляющих персональные данные, идентификаторами с созданием таблицы соответствия таких идентификаторов исходным данным);
    • изменение состава или семантики (обобщение, изменение значений атрибутов персональных данных или удаление части сведений, позволяющих идентифицировать субъекта);
    • декомпозиция (разделение массива персональных данных на несколько составляющих частей с последующим их раздельным хранением);
    • перемешивание (перестановка отдельных значений атрибутов персональных данных в массиве).
    При выборе метода обезличивания мы рекомендуем ознакомиться с положениями этого приказа, поскольку методы применяются в зависимости от целей и задач обработки персональных данных.

    В этом же приказе приводится понятие деобезличивания – действий, в результате которых обезличенные данные принимают вид, позволяющий определить их принадлежность конкретному субъекту персональных данных.

    Из этого можно сделать вывод, что обезличенные данные не являются персональными данными.

    Этот вывод подтверждается в российской судебной практике. Например, в решении Верховного Суда РФ от 26 января 2011 г. № ГКПИ10-1510; решении Арбитражного суда Удмуртской области по делу № А71-6910/2013 от 25 сентября 2013 г.

    Однако существует и противоположная позиция, заключающаяся в том, что информация, не позволяющая однозначно идентифицировать лицо, признавалась персональными данными. Она исходит из анализа норма закона, из которых исходит, что обработка обезличенных данных является обработкой персональных данных. Эта позиция подтверждается самим определением обезличивания, которое подразумевает, что при обезличивании информация приводится к тому виду, при котором идентифицировать субъекта персональных данных все же возможно посредством привлечения дополнительной информации.

    Таким образом, при подготовке к публикации наборов открытых данных, содержавших персональные данные, рекомендуется либо заручиться согласием на обработку персональных данных на все действия, которые планируется с ними совершить, у лиц, информация о которых содержится в этих данных, либо прибегнуть к такому методу обезличивания, при котором косвенная идентификация лица с использованием дополнительной информации невозможна. При этом обращаем внимание, что даже в этом случае закон допускает обработку обезличенных данных без согласия лица только в статистических или иных исследовательских целях.

    С другой стороны – чем больше обезличены данные, тем, как правило, меньшую ценность они имеют. В этой связи в европейском законодательстве, а именно, в GDPR, утвердился подход, в котором разделяют псевдоанонимизацию и анонимизированность. Первая предполагает, что в результате использования дополнительной информации все же возможно определить принадлежность данных определенному лицу. Вторая подразумевает такую степень обезличенности, при которой данные не относятся к определенному или определяемому лицу, и, соответственно, не являются персональными.

    В последнее время в России можно наблюдать тенденцию усиления регулирования анонимизированных данных. Так, например, идет работа над законопроектом Министерства цифрового развития, связи и массовых коммуникаций, в котором даются определения обезличенных данных и обезличенных персональных данных. Подход к этим понятиям повторяет европейское законодательство. В законопроекте предусмотрены и другие изменения в части целей, способов обработки данных, обезличивания, а также способов выражения согласия субъекта данных на обработку.
    Форматы публикации
    Для публикации открытых данных необходимо использовать на портале все данные должны быть представлены в виде наборов в машиночитаемых форматах. Приведем более подробные рекомендации по предпочтительным форматам публикуемых материалов.
    Табличные данные: CSV, XLSX
    Для табличных данных наиболее предпочтителен формат CSV. Он наиболее прозрачен, с точки зрения структуры, и не допускает путаницы, связанной со скрыванием или сливанием ячеек. Если всё же публиковать данные в формате проприетарной таблицы, то предпочтителен формат XLSX (а не XLS). Это связано с тем, что XLSX как более новый формат занимает меньше места и имеет более удобную для дальнейшей обработки структуру.
    Данные с иерархической структурой: JSON, XML
    В большинстве случаев JSON представляется наиболее удобной для обработки структурой за счет того, что она легко переводится во встроенные структуры многих языков программирования. К файлам такого типа рекомендуется прилагать описание полей, потому что их названия зачастую малоинформативны.
    XML, с другой стороны, дает возможность более полного и структурированного описания данных. Таким образом, использование формата XML лучше свести только к тем случаям, которые выходят за рамки возможностей формата JSON.
    К файлам XML следует прилагать также их схемы, чтобы у пользователь мог обращаться к описанию данных и их структуры.
    Дампы баз данных: BSON, SQL, XML, JSON
    При публикации дампов баз данных лучше избегать устаревших форматов вроде DBF, потому что современные инструменты обработки могут воспринимать их с трудом. Дампы баз данных вроде MongoDB имеет смысл публиковать как есть, то есть в формате BSON. SQL можно использовать для дампов реляционных баз данных.
    Также в ряде случаев может оказаться проще выгрузить данные базы, сохранив их структуру, в папку с файлами JSON или XML.
    Архивация: ZIP
    Файлы большого размера могут публиковаться в виде архивов. Для архивации файлов и папок лучше использовать формат ZIP как наиболее распространенный и часто используемый среди пользователей.
    Типичные ошибки при публикации материалов
    Ошибка 1. Публикация в неадекватном формате
    Например, нет смысла публиковать большую таблицу с данными в виде многостраничного файла PDF. Такой публикацией просто нельзя воспользоваться, потому что этот формат крайне затрудняет дальнейшую компьютерную обработку, в нем невозможны подсчеты и сортировка, а путем чтения из него нельзя вынести обобщенной информации.
    Ошибка 2. Публикация только результатов анализа без исходных данных
    Типичный пример – отчеты об исследованиях на основе данных. Разумно такие документы публиковать именно в виде документов (например, в формате PDF). Но при этом очень желательно сопровождать публикацию такого материала дополнительными файлами, содержащими сами данные, собранные или использовавшиеся в ходе исследования. Разумеется, такая сопутствующая публикация не всегда возможна (есть ограничения, связанные с персональными данными, а также с закрытыми данными, не предназначенными к публикации). Но во всех случаях, когда это возможно, «сырые» данные публиковать нужно, потому что они зачастую представляют собой и самостоятельный интерес, не говоря уже о том, что их публикация позволяет проверять и верифицировать обобщения, сделанные в ходе исследования. То же самое касается публикации инфографики и любых других материалов, в основе которых лежат структурированные данные.
    Ошибка 3. Публикация с неинформативным описанием
    Чтобы пользователь определил, насколько ему интересен опубликованный материал, у материала должно быть краткое и емкое описание. Кроме того, имеют значение даты его создания и последнего обновления, а также его источник (-и).
    Ошибка 4. Отсутствие справочников для данных, содержащих шифры или условные обозначения
    Чтобы данными можно было пользоваться, необходимы расшифровки и пояснения используемых сокращений, обозначений, единиц измерения и т.п. Это особенно актуально в случаях, когда публикуются таблицы или иные структурированные данные, в которых часто бывают сокращенными названия полей (столбцов) или приведены только величины без их размерности. Например, если столбец называется «сумма», то требуется расшифровка, в которой бы указывалось, в чем эта сумма измеряется. Справочники лучше всего делать в виде отдельных файлов — документов или таблиц.
    Примеры проектов по публикации данных
    Портал открытых данных Министерства культуры РФ
    Министерство культуры РФ разработало специальный портал публикации данных в рамках которого изначально реализовал ряд важнейших функций необходимых потребителям данных в сфере культуры.
    • Портал поддерживает такие функции как:
    • Связанные данные (Linked Data);
    • Подписку на обновление наборов данных;
    • Морфологический поиск;
    • Программный интерфейс доступа (REST API);
    • Удобное представление данных в табличной и картографической формах.
    На 2020 год этот портал остаётся наиболее продуманным порталом открытых данных, эксплуатируемым органами власти. Он обеспечивает доступность 74 наборов данных, включая государственные каталог музейного фонда и имеет значительное число частных и корпоративных пользователей, таких как Яндекс, 2do2go и других.
    Портал данных НКО
    В 2018 году АНО Инфокультура на средства президентского гранта был создан портал "Данные НКО". Целью которого было создать площадку для раскрытия данных некоммерческими организациями для публикации данных, созданных в рамках своей деятельности.
    Проект был создан на базе ПО для создания каталога данных CKAN , который был переведён на русский язык и доработан для возможности учёта регистрации данных от российских юридических лиц – включая коды ИНН/ОГРН организации.

    Проект можно назвать частично успешным. Его запуск показал общую неготовность НКО публиковать данные о своей деятельности по причине общего непонимания принципов работы с данными и на сегодняшний день проект продолжается в форме обучения НКО работе с данными.

    При создании проекта были разработаны методические рекомендации для НКО о том как публиковать данные которые включают подробные практические инструкции
    Агрегация данных
    Сбор данных в России на централизованных порталах, агрегация данных для создания продуктов, проведения исследований, предоставление данных для повторного использования, всё это ограничено, в первую очередь, отсутствием работы над стандартизацией данных.

    Из данных обязательных к публикации в России, можно выделить административные данные, которые все органы власти обязаны публиковать согласно 8-ФЗ и подзаконным актам, это: сведения о структуре органа власти, подведомственных учреждениях, вакансиях и так далее. Несмотря на то что эти сведения публикуются тысячами организаций по России, за всё время работа по стандартизации их представления даже не начиналась и, как следствие, при агрегации данных требуется решить большое число технических проблем/задач необходимых для приведения данных к единому стандарту.

    Аналогичная ситуация возникает при сборе иных, менее урегулированных данных подлежащих к раскрытию. Отсутствие стандартизации в публикации данных оставляет возможность по их использованию, только коммерческим проектам с большими финансовыми ресурсами, но, в итоге эти данные в очищенном виде остаются только у компаний проинвестировавших в их агрегацию и очистку значительные средства и, как следствие, продающие их с целью вернуть свои инвестиции.

    Примеры проектов по агрегации данных в России включают:
    • Данные НКО – проект по агрегации данных, публикуемых некоммерческими организациями. Создан АНО Инфокультура на средства президентского гранта
    • Портал открытых данных РФ – портал открытых данных РФ созданный и поддерживаемый Минэкономразвития России и агрегирующий данные опубликованные органами власти на уровне субъектов федерации, муниципальных образований и федеральных органов власти.
    • Хаб открытых данных – портал открытых данных созданный АНО Инфокультура для агрегации наиболее ценных наборов данных и архивов сайтов в рамках проекта "Национальный цифровой архив России".
    Также существуют академические и внутриуниверситетские порталы по агрегации данных, связанных с экономикой, социологией и иными, в первую очередь, общественными науками.
    Повышение качества данных
    Помимо собственно присутствия данных в открытом доступе и снабжения их некоторой правовой основой, на возможностях использования также сказывается качество данных. Под качеством данных понимается совокупность характеристик, определяющих пригодность данных к использованию. В их число входят такие моменты, как:
    • Своевременное обновление (актуализация) данных;
    • Наличие метаданных, позволяющих судить о правах использования данных, их составителях, публикаторах и тематике;
    • Наличие описания структуры данных (их схемы, а также значения полей);
    • Валидность структур, содержащих данные (при наличии ошибок автоматическая обработка может оказаться невозможной);
    • Соответствие данных описанию (в том числе в части форматов значений; наличия/отсутствия значений null);
    • Отсутствие в данных фактических ошибок (неверных значений).
    Данные, качество которых ниже допустимого уровня, невозможно использовать, даже если они формально отвечают критериям открытости. То же самое можно сказать и о документах (помимо упомянутых характеристик, здесь можно также упомянуть качество графических изображений). Соответственно, повышение качества материалов — это одно из важных условий их централизованной публикации. Платформа, которая берет на себя такую функцию, должна располагать возможностью, с одной стороны, поощрять публикацию материалов высокого качества, а с другой стороны, сообщать пользователю, какого качества ему стоит ожидать от той или иной публикации.

    Способы повышения качества:

    Пользовательские комментарии. Это самый простой способ передачи информации о качестве материалов. В комментариях (отзывах) пользователи могут высказывать свои претензии к качеству, делиться мнениями о том, что можно было бы улучшить и обсуждать эти мнения. Также пользователи могут оставлять одобрительные отзывы. Тем самым, с одной стороны, публикатор получает от пользователей обратную связь и, следовательно, возможность учитывать пожелания и совершенствовать свои материалы; а с другой стороны, пользователи могут ориентироваться на комментарии, чтобы составить себе представление о качестве публикации. Достоинство такого подхода в простоте реализации. Недостаток в том, что разрозненные комментарии плохо поддаются обобщению; их написание и чтение занимают время; наличие комментариев требует модерации.

    Рейтингование. Более совершенным способом оценивания публикаций представляется рейтинг. Рейтинг может строиться на основе пользовательских оценок, выносимых конкретным публикациям. Эти оценки могут использоваться как для присвоения оценки публикации (например, как среднее значение всех пользовательских оценок), так и для присвоения оценки организации-публикатору (уже не напрямую, а как среднее значение оценок, полученных ее материалами).

    Рейтинг, с одной стороны, может служить стимулом для публикатора, чтобы повышать качество, а с другой стороны, индикатором качества для пользователей. Процедура вынесения пользовательской оценки может быть разной. Наиболее простым способом было бы предложить пользователям выносить общую оценку набору или документу, например, по пятибалльной шкале. Но при таком подходе значение рейтинга может оказаться больше статусным, чем информативным для пользователей. Другой вариант — это предлагать пользователю, желающему вынести оценку, небольшую форму с детализацией параметров оценки (таких, как качество описания данных, заполненность метаданных, актуальность набора данных, качество данных в наборе, корректность документа и т.п.). Общая оценка набора или документа в таком случае будет выводиться из оценок по каждому из предложенных параметров. Это усложнит процедуру вынесения оценки и, вероятно, демотивирует некоторых пользователей, но такой подход мог бы способствовать более ответственному вынесению оценок и позволял бы другим пользователям судить о том, насколько для них релевантны недостатки, из-за которых была снижена оценка.

    Стандартизация. В отличие от двух предыдущих подходов, наличие стандарта дает возможность выносить не произвольную оценку, а оценку относительно соответствия этому стандарту. В то же время стандарт представляет собой готовый эталон, на который может ориентироваться публикатор при подготовке своих материалов. Разработка стандарта требует специальной целенаправленной работы, которая может оказаться долгой и ресурсозатратной. Однако стандартизация может оказаться наиболее эффективным инструментом повышения качества публикаций.

    Выводы и рекомендации
    1
    Развитие нормативной базы:
    • Введение более четкой нормативной терминологии, в том числе через инструменты технического регулирования;
    • Ратифицировать Хартию открытых данных
    • Внедрить практику «открытость по умолчанию» при создании информационных систем и ведения реестров;
    • Коррекция регулирования персональных данных для более адекватного соответствия сложившимся реалиям цифровой экономики.
    2
    Обеспечение открытости всех созданных и создаваемых государственных и муниципальных информационных систем в рамках унифицированных требований в технических заданиях на их разработку и модернизацию
      3
      Обеспечение перевода в машиночитаемую форму данных, подлежащих к обязательному раскрытию не только органами власти, но и субъектами регулирования (деклараций, отчетности монополистов и т.д.).
      4
      Развитие просветительской деятельности среди потенциальных публикаторов данных для повышения доступных наборов данных и преодоления фрагментированности сообщества.
      Подготовлено АНО "Информационная культура" при поддержке компании Microsoft
      Контакты
      Мы будем рады обсудить ситуацию с открытыми данными в России
      E-mail: infoculture@infoculture.ru