Новостной портал ЦТЭП ИДУ
Центр технологий электронного правительства Института дизайна и урбанистики
Национальный исследовательский Университет ИТМО

Российские ученые создали метод отслеживания решений ИИ

"С помощью нового метода можно определить, в какой момент ИИ начинает давать неправильные или нежелательные ответы, и вовремя скорректировать их. Это прорывной шаг на пути к более прозрачным, точным и понятным алгоритмам, что особенно важно при внедрении ИИ в критически важные сферы, такие как медицина, финансы и безопасность", - говорится в сообщении.

Современные языковые модели (LLM) состоят из нескольких слоев, каждый из которых использует результат предыдущего. Новый метод SAE Match позволяет заглянуть внутрь модели и понять, как меняются концепции от слоя к слою. "Это дает возможность контролировать процесс генерации текста, а не просто накладывать внешние ограничения или обучать модель на новых данных, что дорого и требует больших вычислительных ресурсов", - отмечается в сообщении.

Результаты исследования доступны в открытых источниках и будут представлены на международной конференции по ИИ (ICRL) в Сингапуре в апреле 2025. По информации компании, SAE Match стал первым инструментом, который не просто фиксирует концепции на отдельных слоях, а анализирует их эволюцию в процессе вычислений.

"Сейчас изменить его поведение (ИИ - прим. ТАСС) - сложная задача, ведь существующие методы не дают нам четкого понимания, где именно возникла проблема. Наши исследования в области интерпретируемости ИИ направлены на то, чтобы такие сбои можно было заметить и быстро исправить их без дорогостоящего переобучения модели. SAE Match - это первый шаг к созданию более прозрачного и надежного искусственного интеллекта, которому можно доверять. И мы планируем продолжить исследования в направлении интерпретируемости ИИ", - приводятся в сообщении слова руководителя научной группы LLM Foundations T-Bank AI Research Никиты Балаганского.

Ранее в лаборатории T-Bank AI Research разработали самый точный в мире метод распознавания неизвестных объектов на фото с помощью ИИ. Отмечается, что благодаря методу риск ошибки при обработке и анализе изображений снизился более чем на 20%, что уменьшило необходимость перепроверки и исправления неверных решений человеком.


Источник: https://www.comnews.ru/content/238772/2025-04-11/2025-w15/1009/rossiyskie-uchenye-sozdali-metod-otslezhivaniya-resheniy-ii
Дата: 11.04.2025

Последние новости:

22.06.2026

Итоги XVII Международного IT-Форума в Югре: 5 тыс участников и 16 соглашений

XVII Международный IT-Форум с участием стран БРИКС и ШОС завершил работу в Ханты-Мансийске; площадка форума объединила около пяти тысяч участников из 43 регионо ...

22.06.2026

В Татарстане прошло более 51 тысячи телемедицинских консультаций через «Макс»

Врачи Татарстана провели более 51 тысячи телемедицинских консультаций и дистанционно закрыли порядка 46,3 тысячи больничных листов с помощью мессенджера «Макс». ...