Российские ученые ускорили работу искусственного интеллекта с длинным текстом

-

Ученые из лаборатории исследований искусственного интеллекта (ИИ) T-Bank AI Research разработали нейросеть ReBased для ускоренной обработки длинных текстов. Новая технология сокращает расходы на использование ИИ в обработке текстов практически без потерь в качестве.

 

В перспективе это позволит шире применять языковые модели в бизнесе, так как сейчас их использование ограничивают высокие затраты на вычислительные мощности. Кроме того, снижение потребления энергии в области вычислений, особенно в больших центрах обработки данных, поможет уменьшить негативное влияние на окружающую среду и сократить выбросы парниковых газов.

 

Результаты исследования были признаны мировым научным сообществом и представлены на 63-й Международной ежегодной конференции по компьютерной лингвистике (ACL), которая проходит в Бангкоке, Таиланд, с 11 по 16 августа 2024 года. Это главная научная конференция в области обработки естественного языка в мире.

 

Научную работу цитировали одни из самых известных исследователей эффективности искусственного интеллекта в мире, представляющие Принстонский университет и Университет Карнеги — Меллона. Почти все языковые модели в мире используют именно их наработки.

 

Суть открытия

 

В основе открытия лежит новая архитектура языковых моделей, названная ReBased. Архитектура в глубоком обучении — это общий план или структура, по которой строится нейронная сеть. Она определяет, какие типы слоев будут использованы (например, сверточные, рекуррентные или полносвязные) и как эти слои будут соединены между собой. Проще говоря, это как проект дома, где есть план этажей, комнаты и их соединения. Хорошо продуманная архитектура позволяет нейросети лучше решать определенные задачи, например распознавать изображения или понимать текст. Выбор подходящей архитектуры важен для эффективности и точности работы модели.

 

Самые распространенные языковые модели основаны на архитектуре «Трансформер», представленной в 2017 году исследователями из Google. Они хорошо зарекомендовали себя при решении практических задач, но для них требуется очень большое количество ресурсов, которые растут квадратично с удлинением текста. Для широкого практического применения необходимы менее ресурсозатратные архитектуры.

 

Наиболее успешные конкуренты трансформеров — последние SSM-модели (State Space Model, модели пространства состояний) Mamba, но они уступают по способности контекстного обучения, которое позволяет ИИ-агентам адаптироваться к новым задачам без необходимости повторного обучения.

 

В модели Based, представленной учеными Стэнфорда в декабре 2023 года, которая значительно улучшила способности контекстного обучения, специалисты T-Bank AI Research обнаружили неэффективное использование ресурсов из-за неоптимальной структуры нейросети.

 

Проведя анализ архитектуры Base, ученые из T-Bank AI Research оптимизировали механизм извлечения информации из текста, добавив новые обучаемые параметры, которые отвечают за оптимальный поиск взаимосвязей между частями текста. Это позволяет улучшить процесс его обработки и получать более точные ответы. Ученые также упростили алгоритм выделения текстовой информации, что привело к увеличению производительности, повышению качества работы с длинными текстами и улучшению контекстного обучения. В среднем понимание взаимосвязей в тексте в новой архитектуре стало лучше на 10%.

 

ReBased способна снизить издержки на использование искусственного интеллекта для специализированных задач, которые имеют конкретную область применения и требуют учета ее особенностей. Например, в медицине такой задачей может считаться классификация текстов на основе симптомов и диагнозов.

 

Новая архитектура, предложенная учеными, позволяет приблизить качество линейных моделей к трансформерам. Модели, в основе которых лежит ReBased, могут генерировать тексты с более низкими требованиями к ресурсам практически без потери качества.

 

Ученые проводили эксперименты на датасете MQAR (Multi-Query Associative Recall), который позволяет определять способность модели к контекстуальному обучению, а именно к ассоциативному запоминанию (запоминанию не связанных пар объектов), например: лицо человека — его имя.

 

Ярослав Аксенов, исследователь обработки естественного языка в T-Bbank AI Research:

«Примечательно, что параллельно с выходом нашей статьи группа исследователей из Стэнфорда выпустила исследование на эту же тему, но с другим подходом к решению. Сейчас это одна из наиболее интересных областей исследований в NLP по всему миру: трансформеры слишком медленные, но линейные модели уступают им по качеству. И мы, и ученые из Стэнфорда занимаемся поиском оптимальных архитектур. Мы ценим их вклад в развитие технологий и рады возможности участвовать в научном диалоге такого уровня».

 

В перспективе линейные модели все чаще будут использоваться в комбинации с трансформерами в качестве составной части гибридных архитектур. Такие архитектуры сочетают в себе и скорость, и высокое качество выполнения задач.

 

Подробное описание модели и результаты экспериментов доступны в статье Linear Transformers with Learnable Kernel Functions are Better In-Context Models.

 

Исходный код и дополнительные материалы можно найти на GitHub.

 

Лаборатория T-Bank AI Research

 

T-Bank Al Research — это одна из немногих российских лабораторий, которые занимаются фундаментальными научными исследованиями на базе бизнеса. Лаборатория входит в состав Центра искусственного интеллекта Т-Банка.

 

Ученые из T-Bank Al Research исследуют наиболее перспективные области ИИ: обработку естественного языка (NLP), компьютерное зрение (CV) и рекомендательные системы (RecSys). По результатам экспериментов они пишут научные статьи для наиболее авторитетных международных научных конференций: NeurIPS, ICML, ACL, CVPR и других.

 

За три года существования команды более 20 статей были приняты на крупнейшие конференции и воркшопы в области ИИ. Научные работы T-Bank Al Research цитируются учеными из университетов Беркли и Стэнфорда, а также исследовательского проекта Google по изучению искусственного интеллекта Google DeepMind.

 

Команда курирует исследовательские лаборатории T-Bank Lab в МФТИ и Omut AI в Центральном университете и помогает талантливым студентам совершать научные открытия.

 

Подпишитесь на наш Telegram-канал и на наш паблик в соцсети Вконтакте, следите за актуальными новостями Перми и Пермского края..

 

 

 

 

 

Посмотреть все новости раздела "Технологии"

 

Рейтинг: 0 Голосов: 0 1854 просмотра
Комментарии (0)

Нет комментариев. Ваш будет первым!

Внимание! Все комментарии проходят ручную модерацию, если ваш комментарий не нарушает Правила, он обязательно появится в обсуждении через небольшой промежуток времени.
Опубликованные комментарии являются частными мнениями лиц, их написавших.
Редакция портала за размещенные комментарии ответственности не несет.

 

 

 

Последние новости
  Все новости

 

 

 

 

Популярные новости за неделю
В Перми пройдет предпремьерный показ фильма «Реплика» (18+) с обсуждением темы технологии копирования человеческого сознания
В Перми пройдет предпремьерный показ фильма «Реплика» (18+) с обсуждением темы технологии копирования человеческого сознания
15 ноября 2024 - Журналист - 0 - 1847

Фильм «Реплика» молодого российского режиссера Амира Исаева о границах морали и науки выйдет в кинотеатрах с 21 ноября. В широкий прокат картину выпускает компания «Русский репортаж». Пермяки смогут увидеть остросюжетную драму в редком для отечественного кино жанре сай-фай одними из первых.

В театре «У Моста» состоится премьера спектакля «Замок Рейвенскрофт»
В театре «У Моста» состоится премьера спектакля «Замок Рейвенскрофт»
15 ноября 2024 - Журналист - 0 - 1562

Невероятно лихо закрученный мистический детектив, в центре которого 5 женщин, труп молодого мужчины и эксцентричный инспектор полиции, который пытается распутать это убийство.

«Сильвия» Лео Делиба приходит на пермскую сцену
«Сильвия» Лео Делиба приходит на пермскую сцену
18 ноября 2024 - Журналист - 0 - 832

В Пермском театре оперы и балета идут репетиции последней премьеры 2024 года — балета Лео Делиба «Сильвия». Новая постановка, над которой работают хореограф Алексей Мирошниченко, дирижер Иван Худяков-Веденяпин, художники Альона Пикалова, Татьяна Ногинова и Алексей Хорошев, будет впервые показана 5, 6, 7 и 8 декабря.

«Он, конечно, не самый красивый, но зато с любовью!» Пермяк Андрей Савочкин соберет букет для Марины Федункив в реалити «Первые на деревне» на ТНТ
«Он, конечно, не самый красивый, но зато с любовью!» Пермяк Андрей Савочкин соберет букет для Марины Федункив в реалити «Первые на деревне» на ТНТ
18 ноября 2024 - Журналист - 0 - 747

В понедельник 18 ноября на ТНТ выйдет новый выпуск реалити «Первые на деревне», в котором звёзды соцсетей перевоспитываются в деревне, вкушая все прелести деревенской жизни. К финалу многие из тех, кто не представлял своей жизни без тоста с авокадо на завтрак и рафа на миндальном молоке, настолько адаптировались к простому сельскому быту, что готовы даже принять роды у коровы. Или же пойти на всё, чтобы добыть себе еду.

Телеком-оператор начнет информировать абонентов о регистрации новых номеров
Телеком-оператор начнет информировать абонентов о регистрации новых номеров
19 ноября 2024 - Журналист - 0 - 695

МегаФон внедряет сервис по информированию своих клиентов о регистрации на них новых номеров мобильного оператора. Это позволит всем абонентам оператора бесплатно получать сообщения об использовании их паспортных данных при регистрации новых договоров на оказание услуг сотовой связи. Сервис подключается автоматически и доступен как для новых, так и действующих клиентов.

 

Новые статьи
«Свеза» инвестирует в эффективность и безопасность производства в Прикамье
«Свеза» инвестирует в эффективность и безопасность производства в Прикамье
18 ноября 2024 - Журналист - 0 - 431
Комбинат «Свеза» в Уральском продолжает инвестировать в развитие производства, вкладывая средства в повышение эффективности и безопасности промышленных процессов. Только за девять...
В октябре в Перми было заключено более 500 сделок с новостройками
В октябре в Перми было заключено более 500 сделок с новостройками
15 ноября 2024 - Журналист - 0 - 982
По данным сервиса Пульс Продаж Новостроек, в октябре 2024 года в российских миллионниках было зарегистрировано около 19 тыс договоров долевого участия (ДДУ) на почти на 1 млн кв.м. Это на 6%* ниже...
«Свеза» направит 2 млн рублей на поддержку социальных проектов в Прикамье
«Свеза» направит 2 млн рублей на поддержку социальных проектов в Прикамье
14 ноября 2024 - Журналист - 0 - 755
Лесопромышленная группа «Свеза» подвела итоги грантового отбора социально значимых проектов «Свеза Рядом» в Пермском крае. В мероприятии приняли участие 20 проектов,...
Аналитика: какие гаджеты пользовались популярностью в дни распродаж
Аналитика: какие гаджеты пользовались популярностью в дни распродаж
14 ноября 2024 - Журналист - 0 - 744
Продажи гаджетов в дни акции «11.11» в интернет-магазине МегаФона превысили средненедельные показатели 2024-го в два раза. По сравнению с аналогичной распродажей прошлого года в этом...

 

 

 

 






 

Top.Mail.Ru
Top.Mail.Ru  

Основные разделы
Новости | Новости Перми | Публикации | Фото | Справка | Вопросы и ответы | SSL |
Информация
О проекте | Правила сайта | Реклама | Партнеры | Сообщить новость | Персональные данные |