Российские ученые ускорили работу искусственного интеллекта с длинным текстом

17 августа 2024 - Журналист

Ученые из лаборатории исследований искусственного интеллекта (ИИ) T-Bank AI Research разработали нейросеть ReBased для ускоренной обработки длинных текстов. Новая технология сокращает расходы на использование ИИ в обработке текстов практически без потерь в качестве.

В перспективе это позволит шире применять языковые модели в бизнесе, так как сейчас их использование ограничивают высокие затраты на вычислительные мощности. Кроме того, снижение потребления энергии в области вычислений, особенно в больших центрах обработки данных, поможет уменьшить негативное влияние на окружающую среду и сократить выбросы парниковых газов.

Результаты исследования были признаны мировым научным сообществом и представлены на 63-й Международной ежегодной конференции по компьютерной лингвистике (ACL), которая проходит в Бангкоке, Таиланд, с 11 по 16 августа 2024 года. Это главная научная конференция в области обработки естественного языка в мире.

Научную работу цитировали одни из самых известных исследователей эффективности искусственного интеллекта в мире, представляющие Принстонский университет и Университет Карнеги — Меллона. Почти все языковые модели в мире используют именно их наработки.

Суть открытия

В основе открытия лежит новая архитектура языковых моделей, названная ReBased. Архитектура в глубоком обучении — это общий план или структура, по которой строится нейронная сеть. Она определяет, какие типы слоев будут использованы (например, сверточные, рекуррентные или полносвязные) и как эти слои будут соединены между собой. Проще говоря, это как проект дома, где есть план этажей, комнаты и их соединения. Хорошо продуманная архитектура позволяет нейросети лучше решать определенные задачи, например распознавать изображения или понимать текст. Выбор подходящей архитектуры важен для эффективности и точности работы модели.

Самые распространенные языковые модели основаны на архитектуре «Трансформер», представленной в 2017 году исследователями из Google. Они хорошо зарекомендовали себя при решении практических задач, но для них требуется очень большое количество ресурсов, которые растут квадратично с удлинением текста. Для широкого практического применения необходимы менее ресурсозатратные архитектуры.

Наиболее успешные конкуренты трансформеров — последние SSM-модели (State Space Model, модели пространства состояний) Mamba, но они уступают по способности контекстного обучения, которое позволяет ИИ-агентам адаптироваться к новым задачам без необходимости повторного обучения.

В модели Based, представленной учеными Стэнфорда в декабре 2023 года, которая значительно улучшила способности контекстного обучения, специалисты T-Bank AI Research обнаружили неэффективное использование ресурсов из-за неоптимальной структуры нейросети.

Проведя анализ архитектуры Base, ученые из T-Bank AI Research оптимизировали механизм извлечения информации из текста, добавив новые обучаемые параметры, которые отвечают за оптимальный поиск взаимосвязей между частями текста. Это позволяет улучшить процесс его обработки и получать более точные ответы. Ученые также упростили алгоритм выделения текстовой информации, что привело к увеличению производительности, повышению качества работы с длинными текстами и улучшению контекстного обучения. В среднем понимание взаимосвязей в тексте в новой архитектуре стало лучше на 10%.

ReBased способна снизить издержки на использование искусственного интеллекта для специализированных задач, которые имеют конкретную область применения и требуют учета ее особенностей. Например, в медицине такой задачей может считаться классификация текстов на основе симптомов и диагнозов.

Новая архитектура, предложенная учеными, позволяет приблизить качество линейных моделей к трансформерам. Модели, в основе которых лежит ReBased, могут генерировать тексты с более низкими требованиями к ресурсам практически без потери качества.

Ученые проводили эксперименты на датасете MQAR (Multi-Query Associative Recall), который позволяет определять способность модели к контекстуальному обучению, а именно к ассоциативному запоминанию (запоминанию не связанных пар объектов), например: лицо человека — его имя.

Ярослав Аксенов, исследователь обработки естественного языка в T-Bbank AI Research:

«Примечательно, что параллельно с выходом нашей статьи группа исследователей из Стэнфорда выпустила исследование на эту же тему, но с другим подходом к решению. Сейчас это одна из наиболее интересных областей исследований в NLP по всему миру: трансформеры слишком медленные, но линейные модели уступают им по качеству. И мы, и ученые из Стэнфорда занимаемся поиском оптимальных архитектур. Мы ценим их вклад в развитие технологий и рады возможности участвовать в научном диалоге такого уровня».

В перспективе линейные модели все чаще будут использоваться в комбинации с трансформерами в качестве составной части гибридных архитектур. Такие архитектуры сочетают в себе и скорость, и высокое качество выполнения задач.

Подробное описание модели и результаты экспериментов доступны в статье Linear Transformers with Learnable Kernel Functions are Better In-Context Models.

Исходный код и дополнительные материалы можно найти на GitHub.

Лаборатория T-Bank AI Research

T-Bank Al Research — это одна из немногих российских лабораторий, которые занимаются фундаментальными научными исследованиями на базе бизнеса. Лаборатория входит в состав Центра искусственного интеллекта Т-Банка.

Ученые из T-Bank Al Research исследуют наиболее перспективные области ИИ: обработку естественного языка (NLP), компьютерное зрение (CV) и рекомендательные системы (RecSys). По результатам экспериментов они пишут научные статьи для наиболее авторитетных международных научных конференций: NeurIPS, ICML, ACL, CVPR и других.

За три года существования команды более 20 статей были приняты на крупнейшие конференции и воркшопы в области ИИ. Научные работы T-Bank Al Research цитируются учеными из университетов Беркли и Стэнфорда, а также исследовательского проекта Google по изучению искусственного интеллекта Google DeepMind.

Команда курирует исследовательские лаборатории T-Bank Lab в МФТИ и Omut AI в Центральном университете и помогает талантливым студентам совершать научные открытия.

Подпишитесь на наш Telegram-канал и на наш паблик в соцсети Вконтакте, следите за актуальными новостями Перми и Пермского края..

Посмотреть все новости раздела "Технологии"

Рейтинг: 0 Голосов: 0 2267 просмотров

Комментарии (0)

Нет комментариев. Ваш будет первым!

Добавить комментарий

Внимание! Все комментарии проходят ручную модерацию, если ваш комментарий не нарушает Правила, он обязательно появится в обсуждении через небольшой промежуток времени.
Опубликованные комментарии являются частными мнениями лиц, их написавших.
Редакция портала за размещенные комментарии ответственности не несет.

Последние новости

Искусство на кончиках пальцев: в Пермско...
19:41

Культура и шоу-бизнес

-0 -116
В Перми предлагают отказаться от паркома...
18:14

Новости Перми и Пермского края

-0 -163
«Нет связи — нет проблем»: в пермском тр...
17:33

Новости Перми и Пермского края

-0 -450
Вся команда: правительство Прикамья гото...
17:10

Новости Перми и Пермского края

-0 -440
«Я очень люблю комедии!»: пермяк Андрей ...
16:50

Кино и ТВ

-0 -286
Дмитрий Махонин поблагодарил пермяков за...
16:16

Новости Перми и Пермского края

-0 -564
Стала известна дата третьего сезона шоу ...
14:51

Кино и ТВ

-0 -529
Битва за тротуар: суд встал на сторону в...
14:10

Новости Перми и Пермского края

-0 -555
Дмитрий Махонин одержал убедительную поб...
11:05

Новости Перми и Пермского края

-0 -547
Мыльные пузыри, индейский квест и выстав...
10:39

Культура и шоу-бизнес

-0 -448
Волшебство на телеэкране: ТВ-3 покажет «...
19:31

Кино и ТВ

-0 -1063
Пермская опера начинает сотрудничество ...
19:24

Культура и шоу-бизнес

-0 -1053

Все новости

Популярные новости за неделю

Исследование: лишь 4% компаний не имеют серьезных киберрисков

11 сентября 2025 - Журналист - 0 - 1354

Уязвимостям высокого и критического уровней в защите своих информационных систем подвержено большинство российского бизнеса — к такому выводу пришли специалисты МегаФона, проанализировав результаты пентестов, проведённых сотовым оператором в 2025 году.

В Пермском крае стали меньше курить

11 сентября 2025 - Журналист - 0 - 1343

Аналитики изучили, как изменились спрос и цены на сигареты и курительный табак. Эксперты проанализировали 21,2 млн чеков, выданных в магазинах по всей стране.

Анимационный фестиваль «Союзмультфильм» снова в Перми

12 сентября 2025 - Журналист - 0 - 1299

Приготовьтесь к незабываемым дням веселья и волшебства!

Прогноз погоды в Перми на выходные 13-14 сентября

12 сентября 2025 - Журналист - 0 - 1248

По данным Яндекс Погоды, в субботу, 13 сентября, в Перми ожидается прохладная и пасмурная погода. Утром температура составит +9°С, днем воздух прогреется до +17°С, вечером будет около +15°С, а ночью температура опустится до +9°С. Ветер северный и западный, 1–3,2 м/с, порывы — до 9 м/с.

Пермяки могут получить грант на реализацию своей социальной идеи. СИБУР-Химпром начинает прием заявок на гранты «Формулы хороших дел»

12 сентября 2025 - Журналист - 0 - 1211

В Перми стартовал прием заявок на ежегодные гранты программы СИБУРа «Формула хороших дел». Лучшие проекты, направленные на развитие города, получат финансирование и будут реализованы в 2026 году. Некоммерческие организации и бюджетные учреждения Перми могут подать заявку на сайте программы до 17 октября.

RSS-лента статей

Новые статьи

Как защитить экран смартфона: стекло против плёнки

сегодня в 14:29 - Журналист - 0 - 119

Самая дорогостоящая часть любого смартфона — это его дисплей. При этом, увы, она же чаще всего и страдает: в лучшем случае просто царапается, делая внешний вид гаджета неопрятным и затрудняя...

От коротких отпусков к частым поездкам: как изменились приоритеты у пермских туристов

вчера в 16:40 - Журналист - 0 - 245

Этим летом в путешествие за границу отправилось на 27% больше пермяков, чем в прошлом году. Существенно вырос интерес к странам Африки и Азии – 58% и 59% соответственно. При этом самой...

Как выбрать сервис или программу для транскрибации: ключевые критерии

вчера в 16:36 - Журналист - 0 - 194

В последние годы услуги транскрибации становятся все более востребованными. Особенно популярными такие сервисы стали среди блогеров, журналистов, студентов и исследователей.

Почему вашему капиталу нужен именно швейцарский счет? Объясняем на пальцах для нерезидентов

15 сентября 2025 - Журналист - 0 - 294

Открытие личного счета в швейцарском банке давно перестало быть привилегией исключительно миллиардов из глянцевых журналов; сегодня это реальная опция для состоятельных нерезидентов, стремящихся к...

RSS-лента статей

Страницы: 1 2 3 Следующая Последняя

Российские ученые ускорили работу искусственного интеллекта с длинным текстом

Основные разделы

Информация