НАВЕРХ

Что такое «ГосДата.хаб» и зачем Минцифры создает озеро данных

Серверный шкаф
Фото: Taylor Vick / Unsplash License
Минцифры создает национальное озеро данных «ГосДата.хаб». Оно объединит потоки информации из госорганов, систематизирует их хранение, обработку и будет формировать отчеты по заданным параметрам. Что в конечном итоге должно обеспечить власти и бизнесу своевременность получения информации для реагирования и прогнозирования развития.

Реализация проекта намечена на 2022-2024 годы, сообщается на сайте Минцифры. Тестовая версия будет запущена уже в 2023 году. Как сообщил глава ведомства Максут Шадаев, «ГосДата.хаб» объединит обезличенные данные всех государственных структур и частного бизнеса и позволит формировать расширенную аналитику.

«Государство будет мотивировать бизнес предоставлять обезличенные данные по отдельным направлениям, которые критически важны для системы госуправления. Обмен данными будет двухсторонним: обезличенные данные государственных датасетов сможет использовать и бизнес для развития собственных решений», — сообщил Шадаев.

Зачем нужен «ГосДата.хаб»

Государственные структуры формируют и предоставляют отчетность в собственном формате, это усложняет структурирование и обработку данных из разных ведомств при создании общих сводных и аналитических документов. «ГосДата.хаб» позволит перейти от разрозненной отчетности к единому формату и получать данные автоматически по заданным заранее алгоритмам.

ЧИТАЙТЕ ТАКЖЕРусский Google Play: как установить NashStore

Разрабатываемые дата-сервисы позволят анализировать состояние отраслей экономики страны и социальной сферы, это даст возможность своевременно реагировать на их изменения и прогнозировать развитие.

В первое время после запуска данные «ГосДата.хаба» будут доступны только для государственных органов, но впоследствии доступ к ним получит и бизнес. Двусторонний обмен данными с частными предприятиями позволит формировать более точные отчеты и прогнозы.

Что такое озеро данных

Озеро данных (Data Lake) — это хранение большого объема информации в необработанном виде без единой структуры. Данные собираются из различных источников и просто хранятся. 

Озеро предназначено для хранения больших объемов данных, его значительно быстрее и дешевле внедрить и использовать из-за того, что нет необходимости структурировать или как-нибудь еще обрабатывать информацию.

В централизованный репозиторий озера данных можно интегрировать облачные вычисления, позволяющие формировать отчеты по заданным алгоритмам, и ускорять получение аналитических сводок.

России предрекли «голландскую болезнь» из-за сильного рубля

Еще по теме
«Яндекс» научил нейросеть распознавать десять языков одновременно
«Яндекс» научил «Алису» помогать с выбором электроники
Российские операторы отключили устаревшую технологию 4G
Почта Gmail протестирует новый дизайн вопреки желанию пользователей
смотреть все
Обсуждение (0)