В Україні офіційно представлено перший масштабний відкритий датасет рукописного тексту — RUKOPYS. Його створення стало важливим кроком для розвитку технологій автоматичного розпізнавання рукописних документів у державному та приватному секторах України.
Про це розповідає Finway
“RUKOPYS став першим системним українським набором даних, що містить структуровані зразки рукописного тексту різних стилів”.
Унікальність та значення нового датасету
Ініціатива реалізована у партнерстві Міністерства економіки, довкілля та сільського господарства України, Мінцифри, AI HOUSE і Українського католицького університету. Саме відсутність локалізованих даних значно гальмувала створення українських моделей для розпізнавання рукописного тексту. Тепер RUKOPYS має заповнити цю критичну нішу, дозволяючи розробникам тренувати системи штучного інтелекту на базі реальних українських документів.
Практичне використання RUKOPYS і цифрова трансформація
Одночасно із запуском датасету стартує спеціальна ініціатива для розробників — хакатон, під час якого команди створюватимуть інструменти для автоматичного переведення рукописних документів у електронний вигляд. Основна увага приділяється реальним сценаріям застосування: обробці заяв, довідок, архівних матеріалів і внутрішньої документації у державних установах.
Очікується, що впровадження RUKOPYS допоможе значно зменшити обсяги ручної роботи з документами та знизити навантаження на державних службовців. Це також сприятиме прискоренню обробки даних і стане важливою складовою переходу до повністю автоматизованого документообігу в органах державної влади.
Варто зазначити, що Міністерство цифрової трансформації України продовжує активну роботу над розвитком напрямів штучного інтелекту. Зокрема, відбулася стратегічна зустріч із представниками Google щодо створення нової AI-інфраструктури для державних сервісів. Одним із ключових проектів є підготовка до масштабного впровадження “Дія.AI” — цифрового помічника на основі штучного інтелекту, який планують інтегрувати до застосунку “Дія”.