Российские ученые ускорили работу искусственного интеллекта с длинным текстом

-

Ученые из лаборатории исследований искусственного интеллекта (ИИ) T-Bank AI Research разработали нейросеть ReBased для ускоренной обработки длинных текстов. Новая технология сокращает расходы на использование ИИ в обработке текстов практически без потерь в качестве.

 

В перспективе это позволит шире применять языковые модели в бизнесе, так как сейчас их использование ограничивают высокие затраты на вычислительные мощности. Кроме того, снижение потребления энергии в области вычислений, особенно в больших центрах обработки данных, поможет уменьшить негативное влияние на окружающую среду и сократить выбросы парниковых газов.

 

Результаты исследования были признаны мировым научным сообществом и представлены на 63-й Международной ежегодной конференции по компьютерной лингвистике (ACL), которая проходит в Бангкоке, Таиланд, с 11 по 16 августа 2024 года. Это главная научная конференция в области обработки естественного языка в мире.

 

Научную работу цитировали одни из самых известных исследователей эффективности искусственного интеллекта в мире, представляющие Принстонский университет и Университет Карнеги — Меллона. Почти все языковые модели в мире используют именно их наработки.

 

Суть открытия

 

В основе открытия лежит новая архитектура языковых моделей, названная ReBased. Архитектура в глубоком обучении — это общий план или структура, по которой строится нейронная сеть. Она определяет, какие типы слоев будут использованы (например, сверточные, рекуррентные или полносвязные) и как эти слои будут соединены между собой. Проще говоря, это как проект дома, где есть план этажей, комнаты и их соединения. Хорошо продуманная архитектура позволяет нейросети лучше решать определенные задачи, например распознавать изображения или понимать текст. Выбор подходящей архитектуры важен для эффективности и точности работы модели.

 

Самые распространенные языковые модели основаны на архитектуре «Трансформер», представленной в 2017 году исследователями из Google. Они хорошо зарекомендовали себя при решении практических задач, но для них требуется очень большое количество ресурсов, которые растут квадратично с удлинением текста. Для широкого практического применения необходимы менее ресурсозатратные архитектуры.

 

Наиболее успешные конкуренты трансформеров — последние SSM-модели (State Space Model, модели пространства состояний) Mamba, но они уступают по способности контекстного обучения, которое позволяет ИИ-агентам адаптироваться к новым задачам без необходимости повторного обучения.

 

В модели Based, представленной учеными Стэнфорда в декабре 2023 года, которая значительно улучшила способности контекстного обучения, специалисты T-Bank AI Research обнаружили неэффективное использование ресурсов из-за неоптимальной структуры нейросети.

 

Проведя анализ архитектуры Base, ученые из T-Bank AI Research оптимизировали механизм извлечения информации из текста, добавив новые обучаемые параметры, которые отвечают за оптимальный поиск взаимосвязей между частями текста. Это позволяет улучшить процесс его обработки и получать более точные ответы. Ученые также упростили алгоритм выделения текстовой информации, что привело к увеличению производительности, повышению качества работы с длинными текстами и улучшению контекстного обучения. В среднем понимание взаимосвязей в тексте в новой архитектуре стало лучше на 10%.

 

ReBased способна снизить издержки на использование искусственного интеллекта для специализированных задач, которые имеют конкретную область применения и требуют учета ее особенностей. Например, в медицине такой задачей может считаться классификация текстов на основе симптомов и диагнозов.

 

Новая архитектура, предложенная учеными, позволяет приблизить качество линейных моделей к трансформерам. Модели, в основе которых лежит ReBased, могут генерировать тексты с более низкими требованиями к ресурсам практически без потери качества.

 

Ученые проводили эксперименты на датасете MQAR (Multi-Query Associative Recall), который позволяет определять способность модели к контекстуальному обучению, а именно к ассоциативному запоминанию (запоминанию не связанных пар объектов), например: лицо человека — его имя.

 

Ярослав Аксенов, исследователь обработки естественного языка в T-Bbank AI Research:

«Примечательно, что параллельно с выходом нашей статьи группа исследователей из Стэнфорда выпустила исследование на эту же тему, но с другим подходом к решению. Сейчас это одна из наиболее интересных областей исследований в NLP по всему миру: трансформеры слишком медленные, но линейные модели уступают им по качеству. И мы, и ученые из Стэнфорда занимаемся поиском оптимальных архитектур. Мы ценим их вклад в развитие технологий и рады возможности участвовать в научном диалоге такого уровня».

 

В перспективе линейные модели все чаще будут использоваться в комбинации с трансформерами в качестве составной части гибридных архитектур. Такие архитектуры сочетают в себе и скорость, и высокое качество выполнения задач.

 

Подробное описание модели и результаты экспериментов доступны в статье Linear Transformers with Learnable Kernel Functions are Better In-Context Models.

 

Исходный код и дополнительные материалы можно найти на GitHub.

 

Лаборатория T-Bank AI Research

 

T-Bank Al Research — это одна из немногих российских лабораторий, которые занимаются фундаментальными научными исследованиями на базе бизнеса. Лаборатория входит в состав Центра искусственного интеллекта Т-Банка.

 

Ученые из T-Bank Al Research исследуют наиболее перспективные области ИИ: обработку естественного языка (NLP), компьютерное зрение (CV) и рекомендательные системы (RecSys). По результатам экспериментов они пишут научные статьи для наиболее авторитетных международных научных конференций: NeurIPS, ICML, ACL, CVPR и других.

 

За три года существования команды более 20 статей были приняты на крупнейшие конференции и воркшопы в области ИИ. Научные работы T-Bank Al Research цитируются учеными из университетов Беркли и Стэнфорда, а также исследовательского проекта Google по изучению искусственного интеллекта Google DeepMind.

 

Команда курирует исследовательские лаборатории T-Bank Lab в МФТИ и Omut AI в Центральном университете и помогает талантливым студентам совершать научные открытия.

 

Подпишитесь на наш Telegram-канал и на наш паблик в соцсети Вконтакте, следите за актуальными новостями Перми и Пермского края..

 

 

 

 

 

Посмотреть все новости раздела "Технологии"

 

Рейтинг: 0 Голосов: 0 1618 просмотров
Комментарии (0)

Нет комментариев. Ваш будет первым!

Внимание! Все комментарии проходят ручную модерацию, если ваш комментарий не нарушает Правила, он обязательно появится в обсуждении через небольшой промежуток времени.
Опубликованные комментарии являются частными мнениями лиц, их написавших.
Редакция портала за размещенные комментарии ответственности не несет.

 

 

 

Последние новости
  Все новости

 

 

 

 

Популярные новости за неделю
Сегодня вечер больших премьер на Первом: шоу «Голос.Дети» и сериал «Юг»: интервью наставников Голоса и комментарии исполнителя главной роли сериала «Юг»
Сегодня вечер больших премьер на Первом: шоу «Голос.Дети» и сериал «Юг»: интервью наставников Голоса и комментарии исполнителя главной роли сериала «Юг»
6 сентября 2024 - Журналист - 1 - 1914

Сегодня в эфире Первого – премьера нового сезона шоу «Голос.Дети»: старт Слепых прослушиваний, где наставники наберут свои команды. А также стартует показ восьмисерийного приключенческого сериала «Юг» с Ярославом Могильниковым в главной роли.

Пермский международный марафон 2024: участники, результаты и интересные моменты
Пермский международный марафон 2024: участники, результаты и интересные моменты
8 сентября 2024 - Журналист - 0 - 1480

7 сентября 2024 года в Перми стартовал традиционный Пермский марафон, который в этом году стал международным. В забеге приняли участие около 13 тысяч спортсменов из 43 регионов России, а также гости из Марокко, Грузии, Казахстана и Таджикистана.

Камера в кармане: 82% пермяков фотографируют на смартфоны
Камера в кармане: 82% пермяков фотографируют на смартфоны
9 сентября 2024 - Журналист - 0 - 994

Пермяки чаще других россиян делают выбор в пользу смартфонов, когда речь идёт о фотографии. Cогласно данным опроса МегаФона, приуроченного к запуску смартфонов серии HONOR 200, 82 % жителей региона снимают преимущественно на телефон. Это самый высокий показатель в России (против 70 %).

Солист «Руки ВВерх» откроет в Перми танцевальный караоке-бар в стиле 90-х
Солист «Руки ВВерх» откроет в Перми танцевальный караоке-бар в стиле 90-х
9 сентября 2024 - Журналист - 0 - 879

Сергей Жуков расширяет географию своих владений и открывает заведение в Перми. «Руки ВВерх! Бар» официально распахнёт свои двери в нашем городе уже в этом году.

Пермские родители дарят школьникам умные часы и лампы
Пермские родители дарят школьникам умные часы и лампы
10 сентября 2024 - Журналист - 0 - 701

Умные часы для детей остаются в топе самых востребованных гаджетов, которые приобретают пермские родители к школе. В этом году спрос на них в августе был в 1,9 раза выше, чем в июле, и половину из них покупали в последние 10 дней месяца. В среднем за 7-10 дней до окончания летних каникул начинался самый активный период покупки устройств для школьников. 

 

Новые статьи
Ваш займ переуступлен. Что это значит?
7 сентября 2024 - Журналист - 0 - 854
Если клиент длительное время не оплачивает задолженность перед кредитором, то МФО может переуступить долг. В этом случае заключается договор цессии, по которому права на долг переходят к другой...
Телеком-оператор усилит цифровизацию в дальневосточном регионе
Телеком-оператор усилит цифровизацию в дальневосточном регионе
4 сентября 2024 - Журналист - 0 - 985
Расширение инфраструктуры связи на территории Иркутской области, а также повышение уровня цифровизации региональной экономики в туризме, ЖКХ, экологии и других отраслях вошли в число тем...
Туристы из Пермского края стали на 88 % чаще ездить в Азию
Туристы из Пермского края стали на 88 % чаще ездить в Азию
3 сентября 2024 - Журналист - 0 - 907
Пермяки этим летом выбирали заграничные путешествия на 10 % чаще, чем годом ранее. Продолжает расти азиатское направление – Вьетнам, Китай и Таиланд. Прирост туристов из...
Где выгоднее взять кредит: на что обращать внимание при принятии решения
2 сентября 2024 - Журналист - 0 - 850
...

 

 

 

 






 

Top.Mail.Ru
Top.Mail.Ru  

Основные разделы
Новости | Новости Перми | Публикации | Фото | Справка | Вопросы и ответы | SSL |
Информация
О проекте | Правила сайта | Реклама | Партнеры | Сообщить новость | Персональные данные |