Сервіс «єДозвіл» отримав ШІ-модуль, що автоматично перевіряє документи, знімаючи рутину з посадовців. Цифровий помічник, пришвидшує видачу дозволів й знижує кількість відмов та помилок. Першим успішним кейсом стала ветеринарна ліцензія, але система вже готова до подальшого масштабування.
У системі «єДозвіл» запрацював новий «розумний» модуль, що аналізує документи за допомогою великої мовної моделі (LLM). І це не просто аналітика, а повна попередня перевірка всіх матеріалів, яка раніше була цілком ручною: правильність дипломів, послідовність даних, зміни в прізвищі, актуальність довідок, відповідність вимогам до освіти, термінів, імен, дат. ШІ не ухвалює рішення, проте готує ґрунт для нього. Дає людині те, на що йде найбільше часу, — попередню перевірку з конкретними коментарями. ШІ робить без упередженості, в замкнутому середовищі — на українських серверах, без передачі даних за кордон.
Пілотний запуск стосується ветеринарної ліцензії. Але це лише початок. Насправді мова про архітектуру, яку можна масштабувати. Про стек, що вміє поєднувати скани документів й структуровану аналітику. А також про команду, яка змогла це реалізувати в умовах жорстких законодавчих обмежень, нестачі даних та високої відповідальності. Що саме зробили та як воно працює всередині — розбираємося далі.
Навіщо пускати ШІ в дозвільну систему?
Ліцензії — не та галузь, де хтось чекає технологічних проривів. Ніхто не оновлює дозволи з iPhone у руці, не мріє про UX. Тут усе консервативно. Але саме тому вона й стала ідеальним полем для впровадження штучного інтелекту.
Проблема проста. Щоб отримати ліцензію підприємець зазвичай готує заявку, прикріплює документи, надсилає їх через «Дію». Далі — заява падає в систему, де її вручну відкриває посадовець та починає перечитувати документі. Один за одним: диплом, посвідчення, довідка, підпис, дата. Порівнює, перевіряє, сумнівається. Якщо щось не так — відмова, не завжди зрозуміла для заявника. Поки той розбирається в причинах відхилення заявки — черга вже зсунулася. Й так по колу.
Ветеринарна ліцензія — саме такий кейс. Складна, багатокомпонентна, з чіткими вимогами до професійної кваліфікації. У заявці може бути кілька співробітників — і кожен із них має пакет документів, який треба вичитати, звірити, затвердити. До впровадження ШІ це робилося вручну. На одну навіть ідеально оформлену заявку треба було витратити певний час — на одну людину це хвилини в ідеальних умовах, без збоїв та відволікань. А якщо людей у заявці багато, чи дані розбіжні? А якщо сертифікат утратив чинність? А якщо прізвище змінилось, чи диплом старий? Все це суттєво уповільнювало процес обробки даних.
Тепер все змінилося. Заявка подається через інтерфейс у «Дії», далі документи автоматично потрапляють до системи «єДозвіл», де вмикається ШІ-модуль. Усі матеріали проходять повну перевірку на логіку, цілісність, відповідність вимогам. Виявлені помилки або невідповідності — підсвічуються. Формується рекомендація щодо рішення. Посадовець відкриває вже не «порожній стіл», а результат аналітики, отримуючи одну з двох рекомендацій: «рекомендувати видачу ліцензії» або «відхилити». У разі відхилення у ШІ-звіті зазначаються причини і невідповідності.
«У публічному секторі є завдання, які ніхто не хоче і не має робити вручну, але вони критично впливають на результат. ШІ-модуль бере на себе цей пласт роботи і дозволяє експертам ухвалювати рішення швидше та впевненіше», — зауважив заступник Міністра економіки, довкілля та сільського господарства України з питань цифрового розвитку, цифрових трансформацій і цифровізації Олександр Циборт.
Важливо: модель не вирішує сама. Вона дає орієнтири. Виділяє те, на що варто звернути увагу. Фінальне рішення завжди ухвалює людина.
Як працює система: від обробки документів до рекомендації
ШІ-модуль у «єДозвіл» —не просто чергова інтеграція LLM, це спроєктована з нуля інфраструктура з чіткою логікою, контрольованим пайплайном і повною відмовою від закордонних хмарних сервісів й без використання закордонних хмарних сервісів. Коли користувач подає заявку, система отримує два потоки даних: структуру заявки (вона надходить у цифровому форматі) та прикріплені документи (найчастіше PDF або зображення). Тут підключається перший модуль на основі Qwen 2.5 7B VL. Він витягує текст із файлів: сканує, розпізнає, розбиває на логічні блоки. Працює як OCR, але набагато гнучкіше. Зокрема, він фіксує неспівпадіння: якщо прізвище в дипломі не збігається із даними у заявці, ця розбіжність автоматично виноситься в окремий рядок.
Qwen 2.5 7B VL це мультимодальна модель з приблизно 7 млрд параметрів, здатна працювати одночасно з текстом та зображеннями. Вона вміє аналізувати картинки, діаграми, відео, визначати об’єкти та їхнє розташування, а також перетворювати візуальні дані у структурований формат. До того ж демонструє найкращі результати серед невеликих відкритих моделей на бенчмарках по розпізнаванню тексту.
Наступний крок — обробка чистого тексту. Тут у гру вступає Gemma 3 27B —велика мультимодальна мовна модель від Google DeepMind з приблизно 27 млрд параметрів, здатна працювати з текстом та зображеннями. Вона має розширене вікно контексту, що дозволяє обробляти навіть дуже довгі документи або великі набори даних за один раз. Модель аналізує контекст, звіряє дані між собою, перевіряє відповідність умовам. Наприклад, чи досяг заявник віку, передбаченого ліцензійними умовами. Або чи вказаний диплом дійсний, і чи його дата укладається в допустимі рамки. Модель працює не з фактами як такими, а з логікою: наскільки повною є заявка, які поля викликають сумніви, чи є нестиковки.
Третій етап — формування висновку. Модель не приймає рішення. Вона виводить пояснення: ось що виявлено, ось чому це може бути критичним, ось рекомендація. Посадовець бачить її у власному інтерфейсі. Якщо все гаразд — схвалює. Якщо ні — повертає заявнику або запускає ручну перевірку.
«У системі працює комбінація моделей: Gemma 3 відповідає за аналіз тексту й формування рекомендацій, а Qwen 2.5 — за розпізнавання доданих документів. Саме поєднання кількох моделей та додаткова обробка файлів роблять це рішення унікальним. Завдяки цьому можна звіряти дані заявника з поданими документами, перевіряти актуальність дипломів й навіть підтверджувати зміну прізвища, якщо в дипломі та свідоцтві про підвищення кваліфікації вони не збігаються», — пояснює Олександр Акуленко, керівник AI-напрямку MK-Consulting.
Усі ці кроки пов’язані в єдину систему, яка побудована на Dify — інструменті для керування агентами та модульною обробкою. Саме за допомогою Dify відбувається зв’язка між Qwen та Gemma, тут налаштована черговість операцій, логіка перевірок, шаблони рекомендацій. Саме тут закладено найважливіше: гнучкість оновлення. Якщо завтра з’явиться краща модель для роботи з українською мовою — її можна буде підключити без переписування всієї системи.
За розробку системи — від оновлення процедур до технічної логіки та інтеграції ШІ-модулю — відповідала команда Міністерства економіки України. Інтерфейс для бізнесу у «Дії» створила команда Мінцифри. Саму ШІ-частину створила команда MK-Consulting. Координацію розробки здійснював Офіс ефективного регулювання BRDO, а фінансування забезпечив Європейський Союз у межах проєкту EU4DigitalUA, що реалізується організацією FIAP. Консультаційну підтримку з підготовки нормативно-правових актів надавав проєкт EU4Business: SMEPIS.
Ще одна важлива деталь — інфраструктура
Увесь процес працює в межах українського датацентру компанії De Novo, без жодного виклику до сторонніх API. У тестуванні брали участь кластер із H100 та двома A100, щоб забезпечити експерименти й стабільність. У продуктивному режимі використовуються дві A100: одна обслуговує Gemma, інша — Qwen. Це дозволяє системі витримувати навантаження, не знижуючи швидкості обробки, яка становить від 2 до 15 хвилин на заявку.
«Поєднання можливостей прискорювачів NVIDIA A100 та H100 - класичне поєднання для потужних проєктів. A100 добре підходить для стабільної роботи великих моделей у продуктивному режимі, тоді як H100 дає можливість експериментувати з новими конфігураціями та масштабуванням. Поєднання цих ресурсів дозволяє витримувати великі навантаження та гарантувати якість сервісу. Але найголовніше — усі обчислення відбуваються в українській хмарі, що напряму пов’язано з цифровим суверенітетом: держава отримує потужність світового рівня без ризику, пов'язаного з виносом даних за кордон», — коментує Генадій Карпов, директор з технологій De Novo.
Що виявляє ШІ та як це бачить посадовець
Це, мабуть, найважливіше. Бо модель — не самостійний експерт і не закритий інструмент, як у багатьох комерційних сервісах. У державній системі важливо не лише те, що модель щось «думає», а й як саме вона пояснює висновки. Після проходження повного циклу перевірки посадовець бачить на екрані структурований результат.