Российские ученые ускорили работу искусственного интеллекта с длинным текстом

-

Ученые из лаборатории исследований искусственного интеллекта (ИИ) T-Bank AI Research разработали нейросеть ReBased для ускоренной обработки длинных текстов. Новая технология сокращает расходы на использование ИИ в обработке текстов практически без потерь в качестве.

 

В перспективе это позволит шире применять языковые модели в бизнесе, так как сейчас их использование ограничивают высокие затраты на вычислительные мощности. Кроме того, снижение потребления энергии в области вычислений, особенно в больших центрах обработки данных, поможет уменьшить негативное влияние на окружающую среду и сократить выбросы парниковых газов.

 

Результаты исследования были признаны мировым научным сообществом и представлены на 63-й Международной ежегодной конференции по компьютерной лингвистике (ACL), которая проходит в Бангкоке, Таиланд, с 11 по 16 августа 2024 года. Это главная научная конференция в области обработки естественного языка в мире.

 

Научную работу цитировали одни из самых известных исследователей эффективности искусственного интеллекта в мире, представляющие Принстонский университет и Университет Карнеги — Меллона. Почти все языковые модели в мире используют именно их наработки.

 

Суть открытия

 

В основе открытия лежит новая архитектура языковых моделей, названная ReBased. Архитектура в глубоком обучении — это общий план или структура, по которой строится нейронная сеть. Она определяет, какие типы слоев будут использованы (например, сверточные, рекуррентные или полносвязные) и как эти слои будут соединены между собой. Проще говоря, это как проект дома, где есть план этажей, комнаты и их соединения. Хорошо продуманная архитектура позволяет нейросети лучше решать определенные задачи, например распознавать изображения или понимать текст. Выбор подходящей архитектуры важен для эффективности и точности работы модели.

 

Самые распространенные языковые модели основаны на архитектуре «Трансформер», представленной в 2017 году исследователями из Google. Они хорошо зарекомендовали себя при решении практических задач, но для них требуется очень большое количество ресурсов, которые растут квадратично с удлинением текста. Для широкого практического применения необходимы менее ресурсозатратные архитектуры.

 

Наиболее успешные конкуренты трансформеров — последние SSM-модели (State Space Model, модели пространства состояний) Mamba, но они уступают по способности контекстного обучения, которое позволяет ИИ-агентам адаптироваться к новым задачам без необходимости повторного обучения.

 

В модели Based, представленной учеными Стэнфорда в декабре 2023 года, которая значительно улучшила способности контекстного обучения, специалисты T-Bank AI Research обнаружили неэффективное использование ресурсов из-за неоптимальной структуры нейросети.

 

Проведя анализ архитектуры Base, ученые из T-Bank AI Research оптимизировали механизм извлечения информации из текста, добавив новые обучаемые параметры, которые отвечают за оптимальный поиск взаимосвязей между частями текста. Это позволяет улучшить процесс его обработки и получать более точные ответы. Ученые также упростили алгоритм выделения текстовой информации, что привело к увеличению производительности, повышению качества работы с длинными текстами и улучшению контекстного обучения. В среднем понимание взаимосвязей в тексте в новой архитектуре стало лучше на 10%.

 

ReBased способна снизить издержки на использование искусственного интеллекта для специализированных задач, которые имеют конкретную область применения и требуют учета ее особенностей. Например, в медицине такой задачей может считаться классификация текстов на основе симптомов и диагнозов.

 

Новая архитектура, предложенная учеными, позволяет приблизить качество линейных моделей к трансформерам. Модели, в основе которых лежит ReBased, могут генерировать тексты с более низкими требованиями к ресурсам практически без потери качества.

 

Ученые проводили эксперименты на датасете MQAR (Multi-Query Associative Recall), который позволяет определять способность модели к контекстуальному обучению, а именно к ассоциативному запоминанию (запоминанию не связанных пар объектов), например: лицо человека — его имя.

 

Ярослав Аксенов, исследователь обработки естественного языка в T-Bbank AI Research:

«Примечательно, что параллельно с выходом нашей статьи группа исследователей из Стэнфорда выпустила исследование на эту же тему, но с другим подходом к решению. Сейчас это одна из наиболее интересных областей исследований в NLP по всему миру: трансформеры слишком медленные, но линейные модели уступают им по качеству. И мы, и ученые из Стэнфорда занимаемся поиском оптимальных архитектур. Мы ценим их вклад в развитие технологий и рады возможности участвовать в научном диалоге такого уровня».

 

В перспективе линейные модели все чаще будут использоваться в комбинации с трансформерами в качестве составной части гибридных архитектур. Такие архитектуры сочетают в себе и скорость, и высокое качество выполнения задач.

 

Подробное описание модели и результаты экспериментов доступны в статье Linear Transformers with Learnable Kernel Functions are Better In-Context Models.

 

Исходный код и дополнительные материалы можно найти на GitHub.

 

Лаборатория T-Bank AI Research

 

T-Bank Al Research — это одна из немногих российских лабораторий, которые занимаются фундаментальными научными исследованиями на базе бизнеса. Лаборатория входит в состав Центра искусственного интеллекта Т-Банка.

 

Ученые из T-Bank Al Research исследуют наиболее перспективные области ИИ: обработку естественного языка (NLP), компьютерное зрение (CV) и рекомендательные системы (RecSys). По результатам экспериментов они пишут научные статьи для наиболее авторитетных международных научных конференций: NeurIPS, ICML, ACL, CVPR и других.

 

За три года существования команды более 20 статей были приняты на крупнейшие конференции и воркшопы в области ИИ. Научные работы T-Bank Al Research цитируются учеными из университетов Беркли и Стэнфорда, а также исследовательского проекта Google по изучению искусственного интеллекта Google DeepMind.

 

Команда курирует исследовательские лаборатории T-Bank Lab в МФТИ и Omut AI в Центральном университете и помогает талантливым студентам совершать научные открытия.

 

Подпишитесь на наш Telegram-канал и на наш паблик в соцсети Вконтакте, следите за актуальными новостями Перми и Пермского края..

 

 

 

 

 

Посмотреть все новости раздела "Технологии"

 

Рейтинг: 0 Голосов: 0 2267 просмотров
Комментарии (0)

Нет комментариев. Ваш будет первым!

Внимание! Все комментарии проходят ручную модерацию, если ваш комментарий не нарушает Правила, он обязательно появится в обсуждении через небольшой промежуток времени.
Опубликованные комментарии являются частными мнениями лиц, их написавших.
Редакция портала за размещенные комментарии ответственности не несет.

 

 

 

Последние новости
  Все новости

 

 

 

Популярные новости за неделю
Исследование: лишь 4% компаний не имеют серьезных киберрисков
Исследование: лишь 4% компаний не имеют серьезных киберрисков
11 сентября 2025 - Журналист - 0 - 1354

Уязвимостям высокого и критического уровней в защите своих информационных систем подвержено большинство российского бизнеса — к такому выводу пришли специалисты МегаФона, проанализировав результаты пентестов, проведённых сотовым оператором в 2025 году.

В Пермском крае стали меньше курить
В Пермском крае стали меньше курить
11 сентября 2025 - Журналист - 0 - 1343

Аналитики изучили, как изменились спрос и цены на сигареты и курительный табак. Эксперты проанализировали 21,2 млн чеков, выданных в магазинах по всей стране. 

Анимационный фестиваль «Союзмультфильм» снова в Перми
Анимационный фестиваль «Союзмультфильм» снова в Перми
12 сентября 2025 - Журналист - 0 - 1299

Приготовьтесь к незабываемым дням веселья и волшебства!

Прогноз погоды в Перми на выходные 13-14 сентября
Прогноз погоды в Перми на выходные 13-14 сентября
12 сентября 2025 - Журналист - 0 - 1248

По данным Яндекс Погоды, в субботу, 13 сентября, в Перми ожидается прохладная и пасмурная погода. Утром температура составит +9°С, днем воздух прогреется до +17°С, вечером будет около +15°С, а ночью температура опустится до +9°С. Ветер северный и западный, 1–3,2 м/с, порывы — до 9 м/с.

Пермяки могут получить грант на реализацию своей социальной идеи. СИБУР-Химпром начинает прием заявок на гранты «Формулы хороших дел»
Пермяки могут получить грант на реализацию своей социальной идеи. СИБУР-Химпром начинает прием заявок на гранты «Формулы хороших дел»
12 сентября 2025 - Журналист - 0 - 1211

В Перми стартовал прием заявок на ежегодные гранты программы СИБУРа «Формула хороших дел». Лучшие проекты, направленные на развитие города, получат финансирование и будут реализованы в 2026 году. Некоммерческие организации и бюджетные учреждения Перми могут подать заявку на сайте программы до 17 октября.

 

Новые статьи
Как защитить экран смартфона: стекло против плёнки
Как защитить экран смартфона: стекло против плёнки
сегодня в 14:29 - Журналист - 0 - 119
Самая дорогостоящая часть любого смартфона — это его дисплей. При этом, увы, она же чаще всего и страдает: в лучшем случае просто царапается, делая внешний вид гаджета неопрятным и затрудняя...
От коротких отпусков к частым поездкам: как изменились приоритеты у пермских туристов
От коротких отпусков к частым поездкам: как изменились приоритеты у пермских туристов
вчера в 16:40 - Журналист - 0 - 245
Этим летом в путешествие за границу отправилось на 27% больше пермяков, чем в прошлом году. Существенно вырос интерес к странам Африки и Азии – 58% и 59% соответственно. При этом самой...
Как выбрать сервис или программу для транскрибации: ключевые критерии
Как выбрать сервис или программу для транскрибации: ключевые критерии
вчера в 16:36 - Журналист - 0 - 194
В последние годы услуги транскрибации становятся все более востребованными. Особенно популярными такие сервисы стали среди блогеров, журналистов, студентов и исследователей. 
Почему вашему капиталу нужен именно швейцарский счет? Объясняем на пальцах для нерезидентов
Почему вашему капиталу нужен именно швейцарский счет? Объясняем на пальцах для нерезидентов
15 сентября 2025 - Журналист - 0 - 294
Открытие личного счета в швейцарском банке давно перестало быть привилегией исключительно миллиардов из глянцевых журналов; сегодня это реальная опция для состоятельных нерезидентов, стремящихся к...

 

 

 

 






 

Top.Mail.Ru
Top.Mail.Ru  

Основные разделы
Новости | Новости Перми | Публикации | Фото | Справка | Вопросы и ответы |
Информация
О проекте | Правила сайта | Реклама | Партнеры | Сообщить новость | Персональные данные |