В Украине официально представлен первый масштабный открытый датасет рукописного текста — RUKOPYS. Его создание стало важным шагом для развития технологий автоматического распознавания рукописных документов в государственном и частном секторах Украины.
Об этом сообщает Finway
«RUKOPYS стал первым системным украинским набором данных, который содержит структурированные образцы рукописного текста различных стилей».
Уникальность и значение нового датасета
Инициатива реализована в партнерстве Министерства экономики, экологии и сельского хозяйства Украины, Минцифры, AI HOUSE и Украинского католического университета. Именно отсутствие локализованных данных значительно тормозило создание украинских моделей для распознавания рукописного текста. Теперь RUKOPYS должен заполнить эту критическую нишу, позволяя разработчикам тренировать системы искусственного интеллекта на основе реальных украинских документов.
Практическое использование RUKOPYS и цифровая трансформация
Одновременно с запуском датасета стартует специальная инициатива для разработчиков — хакатон, во время которого команды будут создавать инструменты для автоматического перевода рукописных документов в электронный вид. Основное внимание уделяется реальным сценариям применения: обработке заявлений, справок, архивных материалов и внутренней документации в государственных учреждениях.
Ожидается, что внедрение RUKOPYS поможет значительно сократить объемы ручной работы с документами и снизить нагрузку на государственных служащих. Это также поспособствует ускорению обработки данных и станет важной составляющей перехода к полностью автоматизированному документообороту в органах государственной власти.
Стоит отметить, что Министерство цифровой трансформации Украины продолжает активную работу над развитием направлений искусственного интеллекта. В частности, состоялась стратегическая встреча с представителями Google по созданию новой AI-инфраструктуры для государственных сервисов. Одним из ключевых проектов является подготовка к масштабному внедрению «Дія.AI» — цифрового помощника на основе искусственного интеллекта, который планируют интегрировать в приложение «Дія».