Новостной портал ЦТЭП ИДУ
Центр технологий электронного правительства Института дизайна и урбанистики
Национальный исследовательский Университет ИТМО

Российские ученые создали метод отслеживания решений ИИ

"С помощью нового метода можно определить, в какой момент ИИ начинает давать неправильные или нежелательные ответы, и вовремя скорректировать их. Это прорывной шаг на пути к более прозрачным, точным и понятным алгоритмам, что особенно важно при внедрении ИИ в критически важные сферы, такие как медицина, финансы и безопасность", - говорится в сообщении.

Современные языковые модели (LLM) состоят из нескольких слоев, каждый из которых использует результат предыдущего. Новый метод SAE Match позволяет заглянуть внутрь модели и понять, как меняются концепции от слоя к слою. "Это дает возможность контролировать процесс генерации текста, а не просто накладывать внешние ограничения или обучать модель на новых данных, что дорого и требует больших вычислительных ресурсов", - отмечается в сообщении.

Результаты исследования доступны в открытых источниках и будут представлены на международной конференции по ИИ (ICRL) в Сингапуре в апреле 2025. По информации компании, SAE Match стал первым инструментом, который не просто фиксирует концепции на отдельных слоях, а анализирует их эволюцию в процессе вычислений.

"Сейчас изменить его поведение (ИИ - прим. ТАСС) - сложная задача, ведь существующие методы не дают нам четкого понимания, где именно возникла проблема. Наши исследования в области интерпретируемости ИИ направлены на то, чтобы такие сбои можно было заметить и быстро исправить их без дорогостоящего переобучения модели. SAE Match - это первый шаг к созданию более прозрачного и надежного искусственного интеллекта, которому можно доверять. И мы планируем продолжить исследования в направлении интерпретируемости ИИ", - приводятся в сообщении слова руководителя научной группы LLM Foundations T-Bank AI Research Никиты Балаганского.

Ранее в лаборатории T-Bank AI Research разработали самый точный в мире метод распознавания неизвестных объектов на фото с помощью ИИ. Отмечается, что благодаря методу риск ошибки при обработке и анализе изображений снизился более чем на 20%, что уменьшило необходимость перепроверки и исправления неверных решений человеком.


Источник: https://www.comnews.ru/content/238772/2025-04-11/2025-w15/1009/rossiyskie-uchenye-sozdali-metod-otslezhivaniya-resheniy-ii
Дата: 11.04.2025

Последние новости:

01.06.2026

Завершен шестой сезон «ПРОФ-IT.Инновация!

29 мая сос­то­ял­ся он­лайн-фи­нал На­ци­ональ­но­го кон­курса «ПРОФ-IT. Ин­но­вация». В фи­нале меж­ду со­бой бо­ролись 29 IT -ре­шений из две­над­ца­ти ре­ги­ ...

01.06.2026

Уроженец Башкортостана вошёл в ТОП-100 IT-лидеров по версии Global CIO

Профессиональный рейтинг «Топ-100 IT-лидеров России — 2026» вновь включил представителя Башкортостана. Четвёртый год подряд Юрий Глущенко признан одним из сильн ...