Российские ученые ускорили работу искусственного интеллекта с длинным текстом

-

Ученые из лаборатории исследований искусственного интеллекта (ИИ) T-Bank AI Research разработали нейросеть ReBased для ускоренной обработки длинных текстов. Новая технология сокращает расходы на использование ИИ в обработке текстов практически без потерь в качестве.

 

В перспективе это позволит шире применять языковые модели в бизнесе, так как сейчас их использование ограничивают высокие затраты на вычислительные мощности. Кроме того, снижение потребления энергии в области вычислений, особенно в больших центрах обработки данных, поможет уменьшить негативное влияние на окружающую среду и сократить выбросы парниковых газов.

 

Результаты исследования были признаны мировым научным сообществом и представлены на 63-й Международной ежегодной конференции по компьютерной лингвистике (ACL), которая проходит в Бангкоке, Таиланд, с 11 по 16 августа 2024 года. Это главная научная конференция в области обработки естественного языка в мире.

 

Научную работу цитировали одни из самых известных исследователей эффективности искусственного интеллекта в мире, представляющие Принстонский университет и Университет Карнеги — Меллона. Почти все языковые модели в мире используют именно их наработки.

 

Суть открытия

 

В основе открытия лежит новая архитектура языковых моделей, названная ReBased. Архитектура в глубоком обучении — это общий план или структура, по которой строится нейронная сеть. Она определяет, какие типы слоев будут использованы (например, сверточные, рекуррентные или полносвязные) и как эти слои будут соединены между собой. Проще говоря, это как проект дома, где есть план этажей, комнаты и их соединения. Хорошо продуманная архитектура позволяет нейросети лучше решать определенные задачи, например распознавать изображения или понимать текст. Выбор подходящей архитектуры важен для эффективности и точности работы модели.

 

Самые распространенные языковые модели основаны на архитектуре «Трансформер», представленной в 2017 году исследователями из Google. Они хорошо зарекомендовали себя при решении практических задач, но для них требуется очень большое количество ресурсов, которые растут квадратично с удлинением текста. Для широкого практического применения необходимы менее ресурсозатратные архитектуры.

 

Наиболее успешные конкуренты трансформеров — последние SSM-модели (State Space Model, модели пространства состояний) Mamba, но они уступают по способности контекстного обучения, которое позволяет ИИ-агентам адаптироваться к новым задачам без необходимости повторного обучения.

 

В модели Based, представленной учеными Стэнфорда в декабре 2023 года, которая значительно улучшила способности контекстного обучения, специалисты T-Bank AI Research обнаружили неэффективное использование ресурсов из-за неоптимальной структуры нейросети.

 

Проведя анализ архитектуры Base, ученые из T-Bank AI Research оптимизировали механизм извлечения информации из текста, добавив новые обучаемые параметры, которые отвечают за оптимальный поиск взаимосвязей между частями текста. Это позволяет улучшить процесс его обработки и получать более точные ответы. Ученые также упростили алгоритм выделения текстовой информации, что привело к увеличению производительности, повышению качества работы с длинными текстами и улучшению контекстного обучения. В среднем понимание взаимосвязей в тексте в новой архитектуре стало лучше на 10%.

 

ReBased способна снизить издержки на использование искусственного интеллекта для специализированных задач, которые имеют конкретную область применения и требуют учета ее особенностей. Например, в медицине такой задачей может считаться классификация текстов на основе симптомов и диагнозов.

 

Новая архитектура, предложенная учеными, позволяет приблизить качество линейных моделей к трансформерам. Модели, в основе которых лежит ReBased, могут генерировать тексты с более низкими требованиями к ресурсам практически без потери качества.

 

Ученые проводили эксперименты на датасете MQAR (Multi-Query Associative Recall), который позволяет определять способность модели к контекстуальному обучению, а именно к ассоциативному запоминанию (запоминанию не связанных пар объектов), например: лицо человека — его имя.

 

Ярослав Аксенов, исследователь обработки естественного языка в T-Bbank AI Research:

«Примечательно, что параллельно с выходом нашей статьи группа исследователей из Стэнфорда выпустила исследование на эту же тему, но с другим подходом к решению. Сейчас это одна из наиболее интересных областей исследований в NLP по всему миру: трансформеры слишком медленные, но линейные модели уступают им по качеству. И мы, и ученые из Стэнфорда занимаемся поиском оптимальных архитектур. Мы ценим их вклад в развитие технологий и рады возможности участвовать в научном диалоге такого уровня».

 

В перспективе линейные модели все чаще будут использоваться в комбинации с трансформерами в качестве составной части гибридных архитектур. Такие архитектуры сочетают в себе и скорость, и высокое качество выполнения задач.

 

Подробное описание модели и результаты экспериментов доступны в статье Linear Transformers with Learnable Kernel Functions are Better In-Context Models.

 

Исходный код и дополнительные материалы можно найти на GitHub.

 

Лаборатория T-Bank AI Research

 

T-Bank Al Research — это одна из немногих российских лабораторий, которые занимаются фундаментальными научными исследованиями на базе бизнеса. Лаборатория входит в состав Центра искусственного интеллекта Т-Банка.

 

Ученые из T-Bank Al Research исследуют наиболее перспективные области ИИ: обработку естественного языка (NLP), компьютерное зрение (CV) и рекомендательные системы (RecSys). По результатам экспериментов они пишут научные статьи для наиболее авторитетных международных научных конференций: NeurIPS, ICML, ACL, CVPR и других.

 

За три года существования команды более 20 статей были приняты на крупнейшие конференции и воркшопы в области ИИ. Научные работы T-Bank Al Research цитируются учеными из университетов Беркли и Стэнфорда, а также исследовательского проекта Google по изучению искусственного интеллекта Google DeepMind.

 

Команда курирует исследовательские лаборатории T-Bank Lab в МФТИ и Omut AI в Центральном университете и помогает талантливым студентам совершать научные открытия.

 

Подпишитесь на наш Telegram-канал и на наш паблик в соцсети Вконтакте, следите за актуальными новостями Перми и Пермского края..

 

 

 

 

 

Посмотреть все новости раздела "Технологии"

 

Рейтинг: 0 Голосов: 0 2176 просмотров
Комментарии (0)

Нет комментариев. Ваш будет первым!

Внимание! Все комментарии проходят ручную модерацию, если ваш комментарий не нарушает Правила, он обязательно появится в обсуждении через небольшой промежуток времени.
Опубликованные комментарии являются частными мнениями лиц, их написавших.
Редакция портала за размещенные комментарии ответственности не несет.

 

 

 

Последние новости
  Все новости

 

 

 

Популярные новости за неделю
Театр-Театр приглашает на премьеру «Капитанская дочка»
Театр-Театр приглашает на премьеру «Капитанская дочка»
26 мая 2025 - Журналист - 0 - 1235

С 27 по 31 мая на большой сцене Театра-Театра пройдёт премьерная серия показов спектакля «Капитанская дочка» (12+). Команда московского режиссёра Александра Пронькина представит оригинальный взгляд на классическое школьное произведение.

Никольская ярмарка и форум «Коми мир» в Кудымкаре объединили 20 тысяч человек
Никольская ярмарка и форум «Коми мир» в Кудымкаре объединили 20 тысяч человек
26 мая 2025 - Журналист - 0 - 1158

В минувшие выходные в столице Коми-Пермяцкого округа прошли сразу два масштабных события, посвящённые национальной культуре — форум «Коми мир» и Никольская ярмарка. Они вошли в число центральных мероприятий в рамках празднования 100-летия Коми-Пермяцкого округа и Года коми-пермяцкого языка. Эти события стали самыми массовыми в этом году и собрали более 20 тысяч зрителей.

Первые речные прогулочные рейсы от причала в «Хохловке» состоятся в июне
Первые речные прогулочные рейсы от причала в «Хохловке» состоятся в июне
26 мая 2025 - Журналист - 0 - 1126

12, 13, 14 и 15 июня гости архитектурно-этнографического музея смогут совершить речные прогулки на теплоходе «Юнга Камы». Прогулочный теплоход будет осуществлять рейсы от причала в музее «Хохловка» и обратно.

Школьники и учителя Пермского края соревновались в знании цифровой безопасности
Школьники и учителя Пермского края соревновались в знании цифровой безопасности
27 мая 2025 - Журналист - 0 - 1124

На площадке МАОУ «Кондратовская средняя школа "Сфера"» прошёл интерактивный квиз по цифровой грамотности, организованный партийным проектом «Цифровая Россия». В интеллектуальном состязании встретились команды учащихся и педагогов, чтобы проверить свои знания о киберугрозах и способах защиты от них.

Жители Перми могут делать заказы из магазинов «Монетка» через Яндекс Еду и Деливери
Жители Перми могут делать заказы из магазинов «Монетка» через Яндекс Еду и Деливери
26 мая 2025 - Журналист - 0 - 1078

Пермяки могут заказать доставку продуктов и других товаров из магазинов «Монетка» в Яндекс Еде и Деливери. К покупке уже доступно более 3 тысяч позиций ассортимента ритейлера, в том числе товары собственных торговых марок «Монетки».

 

Новые статьи
Кризис хладагентов – новая возможность для технологического роста Российского холодильного машиностроения
30 мая 2025 - Журналист - 0 - 342
28 мая 2025 года в Москве, в рамках Энергетического форума выставки «Тепло и Энергетика 2025», прошла 6-я Всероссийская конференция главных механиков, инженеров и энергетиков...
Пермяки стали чаще выбирать речные маршруты для отдыха
Пермяки стали чаще выбирать речные маршруты для отдыха
30 мая 2025 - Журналист - 0 - 259
В этом году пермяки начали заранее подбирать речные туры. За апрель и первую половину мая интернет-трафик на ресурсах для бронирования таких круизов вырос на 10% в сравнении с тем же периодом...
«Свеза» вложила более 180 млн рублей в модернизацию комбината в Уральском
«Свеза» вложила более 180 млн рублей в модернизацию комбината в Уральском
27 мая 2025 - Журналист - 0 - 479
Комбинат лесопромышленной группы «Свеза» в поселке Уральский Пермского края к концу мая 2025 года инвестировал более 180 млн рублей в обновление оборудования. Модернизация затронула...
Как выбрать микрозайм и не переплатить: главные правила
Как выбрать микрозайм и не переплатить: главные правила
27 мая 2025 - Журналист - 0 - 419
Микрозаймы стали популярным финансовым инструментом благодаря скорости оформления и минимальным требованиям к заемщикам. Однако не все кредиторы предлагают выгодные условия, а некоторые скрывают...

 

 

 

 






 

Top.Mail.Ru
Top.Mail.Ru  

Основные разделы
Новости | Новости Перми | Публикации | Фото | Справка | Вопросы и ответы |
Информация
О проекте | Правила сайта | Реклама | Партнеры | Сообщить новость | Персональные данные |