Українська національна велика мовна модель

Шукаємо дані для тренування моделі та експертів, які долучаться до створення національної мовної моделі для побудови AI-суверенітету України
Стати частиною команди

Мінцифра та Київстар створюють першу українськомовну модель національного масштабу

LLM стане базою для держсервісів, оборонних рішень і бізнесу в Україні
Розумітиме українців краще за іноземні аналоги
Знатиме наш контекст, діалекти, терміни, історію та культуру, тож зможе відповідати якісно
Зробить AI доступним для держсектору
Покращить сервіси для людей і зробить державу ефективнішою
Стане основою для оборонного AI
Забезпечить технологічну незалежність і захист даних — без виведення за межі України
Власна модель — це основа AI-суверенітету та національної безпеки. Наші дані будуть в Україні, а не мандруватимуть світом.

Roadmap розробки моделі

01
Організація та збір даних
Ми тут
02
Пілотна модель та розробка Guardrail
03
Модель середнього масштабу
грудень 2025
04
Вирівнювання і fine-tuning
05
Фінальна модель
06
Запуск першої версії моделі

Хто нам потрібен

Ми шукаємо лідерів із реальними досягненнями та визнанням у профспільноті. Якщо ви готові до міждисциплінарної роботи заради великої національної мети — долучайтеся до робочої групи або проєктного офісу зі створення LLM. Відбір фахівців в експертні групи здійснюється на основі вимог зазначених нижче.
Проєктний офіс
розробляє модель
Робоча група
контролює розробку моделі з технічного, етичного та культурного боків (на громадських засадах)
Науково-технічний напрям
LLM Architect
Big Data Engineer
ML Engineer (Data Preparation)
Data Scientist (NLP, Model Training)
LLM Ops Engineer
AI Red Teamer
Data Science Lead (NLP)
Data Engineer (NLP)
MLOps
QA Engineer (NLP)
Проєктний менеджер (NLP)
Експерт з обробки природної мови (NLP)
Стати частиною команди
Етико-правовий напрям
Фахівці із захисту прав людини
Експерти з протидії дискримінації, упередженням
Юристи сфери захисту персональних даних
Юристи сфери інтелектуальної власності
Фахівці з EU AI Act та GDPR
Стати частиною команди
Культурно-історичний напрям
Мовознавці
Літературознавці
Історики
Культурознавці
Експерти з протидії пропаганді
Представники креативних індустрій
Стати частиною команди
Мовознавчий напрям
Літературознавці
Перекладачі
Мовознавці
Діалектологи
Термінологи
Лексикографи
Фразеологи
Літературні редактори
Коректори
Експерти зі стилістики
Редактори текстів
Аналітики термінологічних стандартів
Стати частиною команди

Вимоги

Профільна вища освіта
Доведений професійний досвід
Реалізовані масштабні проєкти в портфоліо
Визнання у професійній спільноті та відмінна репутація
Наявність наукових чи фахових публікацій
Бажання побудувати
AI-суверенітет України
Надіслати CV
Станьте частиною команди, яка творить український AI. Працюйте з фахівцями різних галузей над проєктом, що має значення для всієї країни
Дедлайн подачі заявок: 14 вересня 2025
Стати частиною команди

Навчіть український AI розуміти нас

Якість LLM залежить від даних. Долучайтеся та діліться своїми текстами для тренування моделі
Хто може допомогти?
IT-компанії, платформи електронної комерції
медіа
автори та видавництва
банки та фінансові установи
освітні онлайн-платформи й заклади
організації, що займаються оцифруванням архівів
університети
культурні та мистецькі організації, музеї
Які дані потрібні?
новини, аналітика, інтерв'ю та блоги
літературні твори, рецензії на книжки та літературна критика
контент навчальних програм та курсів
освітні матеріали, академічні роботи
дані служб підтримки
корпоративних блогів, технічної документації та навчальних матеріалів
описи товарів та відгуки покупців
оцифровані архіви
маркетингові матеріали
Кожен гігабайт, слово і токен — ваш внесок у створення AI з українським культурним кодом 
Розкажіть про ваші дані, які можуть бути корисними для LLM
Надати інформацію про дані