Исследователи НИУ ВШЭ дообучили открытую языковую модель на корпусе iFORA‑QA, собранном более чем 150 экспертами института из научных отчётов и документов в сфере науки и технологий. Адаптированная под русскоязычную научную терминологию система прошла государственную регистрацию: теперь она точнее анализирует научно‑технические тексты, генерирует ответы в 2,7 раза быстрее и потребляет на 73 % меньше памяти по сравнению с исходной мультиязычной моделью – это позволяет запускать ИИ на менее мощном оборудовании.
В перспективе на базе разработки создадут мультиагентную систему для автоматизированного анализа научно‑технической информации. В неё войдут «умный» поисковик с ответами и ссылками на научные источники (чтобы снизить риск галлюцинаций ИИ), граф связей между данными для поиска скрытых закономерностей и модуль работы с неполными данными – он будет задавать уточняющие вопросы перед формированием ответа. Как отметила Анастасия Малашина, главный аналитик проекта, цель – получить модель, которая глубоко понимает труды российских учёных и инженеров, в отличие от универсальных систем, ориентированных преимущественно на англоязычные данные.

Свежие комментарии