Ученые НИУ ВШЭ научились сжимать большие языковые модели без потерь в качестве

Исследователи из Института искусственного интеллекта и цифровых наук (Институт ИИиЦН) ФКН НИУ ВШЭ разработали новый метод сжатия больших языковых моделей, таких как GPT и LLaMA, который позволяет уменьшить их объем на 25–36% без дополнительного обучения и значительной потери в точности. Это первый подход, который использует математические преобразования — вращения весов модели, — чтобы сделать модели более удобными для сжатия с помощью структурированных матриц. Результаты исследования опубликованы в ACL Findings 2025. Код метода доступен на GitHub.
Большие языковые модели, такие как ChatGPT и LLaMA, показывают впечатляющие результаты в генерации текста, переводе и других задачах, но их огромный размер делает их дорогими в использовании и хранении. Традиционные методы сжатия — уменьшение точности чисел, удаление лишних связей или упрощение структуры — часто требуют долгого дообучения модели и могут ухудшить ее работу. Ученые искали способ сократить объем модели быстро и без потери ее интеллекта.
Исследователи НУЛ матричных и тензорных методов в машинном обучении Института ИИиЦН факультета компьютерных наук НИУ ВШЭ предложили метод ProcrustesGPT, основанный на идее, что выходные данные модели не меняются, если применить к ее внутренним весам специальные ортогональные преобразования — своего рода математические повороты. Как объясняют ученые, это такое преобразование пространства, которое может как угодно повернуть или перевернуть картинку, но не может растянуть или сжать ни один объект. Например, если взять лист бумаги с нарисованным на нем треугольником, то можно перевернуть или повернуть его под любым углом — длины сторон и углы между ними останутся точно такими же. В математике такое преобразование и называется ортогональным. Эти преобразования подбираются так, чтобы веса модели лучше поддавались сжатию с помощью структурированных матриц — математических конструкций, которые занимают гораздо меньше памяти.
Екатерина Гришина
Екатерина Гришина, стажер-исследователь НУЛ матричных и тензорных методов в машинном обучении, объясняет: «В основе нашей работы лежит изящная математическая концепция — задача Прокруста. Как и мифический герой, подгонявший путников под свое ложе, этот метод помогает найти идеальное ортогональное преобразование, которое подгоняет веса модели под простую структуру без искажения ее сути. Именно эта идея дала имя нашему методу — ProcrustesGPT — и стала ключом к сжатию без значительной потери качества».
В рамках работы были опробованы два типа таких структур: суммы кронекеровских произведений и GS-матрицы. Метод не требует дообучения модели, работает быстро и может применяться к уже существующим моделям. Эксперименты проводились на открытых моделях OPT и LLaMA2.
Новый метод ProcrustesGPT демонстрирует эффективность: он позволяет уменьшить объем больших языковых моделей на треть, а точнее, на 25–36% от исходного размера, сохранив при этом их интеллектуальные способности. Сжатые модели показывают результаты, близкие к оригиналам: на генерации связного текста и решении логических задач они сохраняют от 90 до 95% своей первоначальной эффективности.
В сравнении с другими современными методами сжатия, например SliceGPT, который также не требует длительного дообучения, ProcrustesGPT в большинстве тестов оказался точнее. Особенно ярко это преимущество проявляется при работе с моделями семейства LLaMA2, на которых разработанный подход опережает аналог на 9–10%.
Максим Рахуба
Максим Рахуба, заведующий НУЛ матричных и тензорных методов в машинном обучении Института ИИиЦН НИУ ВШЭ, рассказывает: «Методы сжатия помогают ускорять внедрение больших языковых моделей в устройства с ограниченными ресурсами, такие как мобильные устройства и IoT-гаджеты, что делает ИИ более доступным и распространенным в повседневной жизни».
Вам также может быть интересно:
В Вышке продолжается набор на программу «ИИ-лидеры: бизнес-лаборатория для руководителей»
26 февраля на факультете компьютерных наук стартует 6-месячное очное обучение. О программе рассказывает ее автор и руководитель Евгений Соколов, научный руководитель Центра непрерывного образования ФКН.
Ученые ВШЭ разработали DeepGQ — Google Maps для G-квадруплексов
Исследователи из Центра искусственного интеллекта ФКН НИУ ВШЭ разработали ИИ-модель, которая открывает новые возможности для диагностики и лечения тяжелых заболеваний, включая рак мозга и нейродегенеративные нарушения. Ученые применили искусственный интеллект для изучения G-квадруплексов — структур, которые оказывают значительное влияние на работу наших клеток и развитие различных органов и тканей. Статья с результатами исследования опубликована в журнале Scientific Reports.
ИИ в науке: страхи и чаяния российских ученых
Искусственный интеллект стал привычным инструментом в ряде стран, однако в российской науке его внедрение пока остается фрагментарным. К такому выводу пришли авторы первого в стране комплексного исследования использования технологий ИИ в научной деятельности. Они провели интервью с ведущими российскими учеными и расспросили их о сферах применения, возможностях и барьерах технологии.
«Выигрывают те, кто умеет быстро адаптироваться и внедрять инновации»
НИУ ВШЭ запускает образовательную программу «ИИ-лидеры: бизнес-лаборатория для руководителей». Обучение рассчитано на 6 месяцев в очном формате, что позволяет глубоко погрузиться в материал и обменяться опытом с коллегами. Программа стартует в феврале 2026 года.
ВШЭ ищет новые идеи для ИИ-агентов: стартовал конкурс инициатив
Высшая школа экономики приглашает исследователей и преподавателей представить концепции новых цифровых продуктов на базе искусственного интеллекта. Лучшие проекты получат экспертную и технологическую поддержку. Заявки принимаются до 19 декабря.
Экономисты ВШЭ выяснили, что ИИ слишком хорошо думает о людях
Ученые из НИУ ВШЭ выяснили, что современные ИИ-модели, включая ChatGPT и Claude, в играх на стратегическое мышление вроде «конкурса красоты» Кейнса переоценивают уровень рациональности своих оппонентов, будь то студенты-первокурсники или опытные ученые. Модели стараются предсказать поведение людей, но в итоге играют «слишком умно» и проигрывают, потому что приписывают людям больше логики, чем те демонстрируют на деле. Исследование опубликовано в Journal of Economic Behavior & Organization.
Вышка Онлайн представила документальный фильм о влиянии ИИ на нашу жизнь
27 ноября на всех онлайн-площадках Вышки Онлайн состоялась премьера документального фильма «После промпта» от онлайн-кампуса НИУ ВШЭ. Его авторы исследуют, как искусственный интеллект меняет работу, карьерные траектории и профессиональное развитие специалистов. Это первый видеопроект, полностью реализованный командой онлайн-кампуса НИУ ВШЭ совместно с приглашенным режиссером Ольгой Науменко.
Технологический прорыв: исследования Института ИИ и цифровых наук отмечены на AI Journey 2025
Ученые Института искусственного интеллекта и цифровых наук факультета компьютерных наук ВШЭ в рамках Международной конференции AI Journey 2025 представили передовые ИИ-исследования с высоким уровнем научной новизны и практической применимости. Научное решение заведующего Научно-учебной лабораторией матричных и тензорных методов в машинном обучении Максима Рахубы получило премию «Лидеры ИИ — 2025». Заведующий Центром глубинного обучения и байесовских методов Айбек Аланов — среди финалистов премии.
«ИИ позволяет людям без опыта разработки прототипировать решения, упрощающие их деятельность»
28 октября завершилось обучение в рамках третьего потока программы «Искусственный интеллект в социальной сфере». Слушатели представили и защитили свои проекты. В рамках освоенного курса преподаватели помогли им найти перспективные области применения ИИ для эффективной работы в социальной сфере и обучили практическому применению инструментов ИИ.
«Искусственный интеллект» — лидер по итогам приема на онлайн-программы НИУ ВШЭ
Онлайн-магистратура «Искусственный интеллект» факультета компьютерных наук НИУ ВШЭ показала рекордные результаты. В этом году на нее подали документы 987 абитуриентов — это абсолютный максимум среди всех магистерских программ Вышки. К обучению приступил 351 первокурсник, что обеспечило программе лидирующую позицию по общему объему приема среди онлайн-магистратур университета.


