5. Системы сбора, хранения, обработки, анализа, моделирования и визуализации массивов данных, в том числе в части систем бизнес-анализа (BI, ETL, EDW, OLAP, Data Mining, DSS)

Общие функциональные характеристики/возможности раздела

Обеспечение сбора данных:
— хранилище неструктурированных данных (проектная документация, технологические регламенты, инструкции, записи в журналах и производственных системах) для реализации решений на базе искусственного интеллекта
— автономная семантическая сегментация, классификация и идентификация, разбиение на объекты и распознавание мелких деталей
— Обеспечение сбора данных в режиме реального времени с устройств IIoT (интернет вещей/датчики и установки различного типа, в том числе MIoT) и реализации решений на основе этих данных
— захват изменений данных (CDC) для отечественных СУБД, функционирующих в гетерогенной среде СУБД
— провижен – автоматизация настройки бизнес-решения, снижения затрат на внедрение
— разграничение данных для разных заказчиков в одной инсталляции
— автоматизированное выставление счетов за использование SaaS, ВааS, DBaaS, MWaaS, PaaS
— визуализация для создания 2D и 3D моделей физических активов с целью интеграции с производственными данными и управления производственными активами, в том числе на основе цифровых двойников
— обработка данных 3D сканирования
— предиктивная (Predictive) и дополненная (Augmented) аналитика, в том числе интеграция с инструментами продвинутой обработки данных (Data Science), автоматическая обработка и интерпретация данных с использованием ИИ, включая технологии семантического анализа данных из различных источников
— модернизация ПО с целью запуска системы на операционных системах отечественной разработки
— интеграция в ИТ-ландшафт крупных предприятий (мониторинг, отказоустойчивость, совместимость с платформами виртуализации, возможность развертывания в нескольких средах – dev, test, prod и др.)

Управление данными:
— управление основными данными MDM/MDG, в том числе единой экосистемой для промышленных предприятий / отраслевой экосистемой MDM
— семантический динамический анализ образов и сцен с учетом контекста и комплексирования данных из различных источников, включая видео, текст, голос
— хранение, обработка и поиск многопараметрических биометрических данных в СУБД общего назначения
— биометрическая идентификация без потребности в физическом носителе
— оптимизация передачи данных – оптимизированный протокол передачи данных и SDK для интеграции протокола в существующие системы для VR/AR специфичных задач
— мониторинг и визуализация параметров инженерных систем, энергопотребления, ресурсов в энергосистемах, на предприятиях, объектах ЖКХ для оценки энергоэффективности потребителей и формирования рекомендаций по ресурсосбережению
— создание единой информационной экосистемы предприятий / интегрированных структур / отраслей, функционирующие в гетерогенной среде ОС, ИС и СУБД
— сбор, анализ и визуализация гетерогенных данных из различных источников, включая сеть Интернет (ETL)
— решение математических задач класса линейного смешанно-численного программирования (MILP), функционирующие на отечественных платформах
— создание, обучение и использование моделей прогнозирования с использованием ИИ, функционирующие на отечественных платформах
— сбор и разметка обучающих данных (датасетов) для машинного обучения с использованием технологий активного обучения, обеспечивающие эффективную работу больших распределенных коллективов разметчиков и механизмы обмена данными в формате маркетплейса
— поиск в больших массивах документов и данных на естественном языке с использованием ИИ
— визуализация многомерных данных для анализа больших данных
— обработка запросов на русском языке (NLP) для идентификации и извлечения намерений пользователей и настраиваемых именованных сущностей на базе механизмов нечеткого поиска
— организация ввода и обработки данных из любых источников с использованием технологий ИИ
— определение на карте траектории движения объекта на базе видеоряда, полученного с камер
— определение типа, возраста и других параметров протяженных объектов (лесных массивов, сельхозугодий, акватории и др.) на базе фотоснимков, в том числе для целей таксации
— детектирование и классификация событий с распределенных оптоволоконных систем мониторинга протяженных объектов

Обеспечение целостности и непротиворечивости данных (консенсус) с распределенным реестром:
— создание и исполнение децентрализованных приложений и смарт-контрактов:
— организация и синхронизация данных на базе распределенного реестра, сокращающие время на подтверждение блоков, позволяющие разворачивать полные ноды на смартфонах,
— обеспечение конфиденциальности данных и безопасности обращения к внешним данным

Анализ и управление версиями:
— компиляторы, поддерживающие синтаксис языков С++
— анализ исходного кода на закладки и уязвимости
— управление версиями

Интеграция и бесшовный переход с иностранных систем:
— бесшовный переход с иностранных программных и аппаратных систем ВКС на отечественное ПО
— поддержка процессоров с архитектурой ARM
— удаленный доступ для пользователей
— модернизация сети передачи данных за счет внедрения технологии SD-WAN

Обеспечение:
— функциональности программного обеспечения на уровне мировых аналогов, используемых в государственных органах и государственных компаниях с учетом требований к функциональным, техническим и эксплуатационным характеристикам, предъявляемым государственными органами и государственными компаниями к соответствующим классам (типам) программного обеспечения
— совместимости прикладных российских программных продуктов между собой, а также с отечественным компьютерным и серверным оборудованием
— работоспособности прикладного программного обеспечения при использовании общесистемного программного обеспечения (операционные системы, серверное и связующее ПО, базы данных и другое ПО), сведения о котором включены в единый реестр российского ПО

Описание приоритетных классов программного обеспечения

Инструменты извлечения и трансформации данных (ETL):
— Программные продукты, которые должны предоставлять возможность извлечения данных из внешних источников, преобразования и очистки данных согласно бизнес-потребностям, загрузки обработанной информации в корпоративное хранилище данных
— Поддержка разработки и внедрения

Предметно-ориентированные информационные базы данных (EDW):
— Предметно-ориентированные информационные базы данных, которые должны быть специально разработанными и предназначаться для подготовки отчетов и бизнес-анализа с целью поддержки принятия решений в организации
— Поддержка разработки и внедрения

Средства аналитической обработки в реальном времени (OLAP):
— Программные продукты, которые должны специализироваться на технологии обработки данных, заключающейся в подготовке суммарной (агрегированной) информации на основе больших массивов данных, структурированных по многомерному принципу
— Поддержка разработки и внедрения

Средства интеллектуального анализа данных (Data Mining):
— Программное обеспечение, которое должно отвечать за обнаружение в данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретаций знаний, необходимых для принятия решений
— Поддержка разработки и внедрения

Средства поддержки принятия решений (DSS):
— Программные продукты, которые должны отвечать за формирование отчетов, графиков, диаграмм и иных визуальных форм
— Поддержка разработки и внедрения

Средства обработки Больших Данных (BigData):
— Совокупность программно-аппаратных средств, которые должны быть предназначены для извлечения воспринимаемых человеком сведений, в результате обработки огромных объемов данных, поступающих с высокой скоростью, при условии их значительного многообразия
— Поддержка разработки и внедрения

Средства математического и имитационного моделирования:
— Программное обеспечение, которое должно предоставлять возможность имитации (моделирования) процесса функционирования различных изделий и систем
— Поддержка разработки и внедрения

Средства управления информационными ресурсами и средства управления основными данными (ECM, MDM):
— Самостоятельные программные компоненты, которые должны предоставлять возможность для управления основными данными организации, поддержки жизненного цикла структурированной, слабоструктурированной и неструктурированной информации (контента) различных типов и форматов
— Поддержка разработки и внедрения