Минцифры создает национальное озеро данных «ГосДата.хаб». Оно объединит потоки информации из госорганов, систематизирует их хранение, обработку и будет формировать отчеты по заданным параметрам. Что в конечном итоге должно обеспечить власти и бизнесу своевременность получения информации для реагирования и прогнозирования развития.
Реализация проекта намечена на 2022-2024 годы, сообщается на сайте Минцифры. Тестовая версия будет запущена уже в 2023 году. Как сообщил глава ведомства Максут Шадаев, «ГосДата.хаб» объединит обезличенные данные всех государственных структур и частного бизнеса и позволит формировать расширенную аналитику.
«Государство будет мотивировать бизнес предоставлять обезличенные данные по отдельным направлениям, которые критически важны для системы госуправления. Обмен данными будет двухсторонним: обезличенные данные государственных датасетов сможет использовать и бизнес для развития собственных решений», — сообщил Шадаев.
Зачем нужен «ГосДата.хаб»
Государственные структуры формируют и предоставляют отчетность в собственном формате, это усложняет структурирование и обработку данных из разных ведомств при создании общих сводных и аналитических документов. «ГосДата.хаб» позволит перейти от разрозненной отчетности к единому формату и получать данные автоматически по заданным заранее алгоритмам.
Разрабатываемые дата-сервисы позволят анализировать состояние отраслей экономики страны и социальной сферы, это даст возможность своевременно реагировать на их изменения и прогнозировать развитие.
В первое время после запуска данные «ГосДата.хаба» будут доступны только для государственных органов, но впоследствии доступ к ним получит и бизнес. Двусторонний обмен данными с частными предприятиями позволит формировать более точные отчеты и прогнозы.
Что такое озеро данных
Озеро данных (Data Lake) — это хранение большого объема информации в необработанном виде без единой структуры. Данные собираются из различных источников и просто хранятся.
Озеро предназначено для хранения больших объемов данных, его значительно быстрее и дешевле внедрить и использовать из-за того, что нет необходимости структурировать или как-нибудь еще обрабатывать информацию.
В централизованный репозиторий озера данных можно интегрировать облачные вычисления, позволяющие формировать отчеты по заданным алгоритмам, и ускорять получение аналитических сводок.