Российские ученые ускорили работу искусственного интеллекта с длинным текстом

-

Ученые из лаборатории исследований искусственного интеллекта (ИИ) T-Bank AI Research разработали нейросеть ReBased для ускоренной обработки длинных текстов. Новая технология сокращает расходы на использование ИИ в обработке текстов практически без потерь в качестве.

 

В перспективе это позволит шире применять языковые модели в бизнесе, так как сейчас их использование ограничивают высокие затраты на вычислительные мощности. Кроме того, снижение потребления энергии в области вычислений, особенно в больших центрах обработки данных, поможет уменьшить негативное влияние на окружающую среду и сократить выбросы парниковых газов.

 

Результаты исследования были признаны мировым научным сообществом и представлены на 63-й Международной ежегодной конференции по компьютерной лингвистике (ACL), которая проходит в Бангкоке, Таиланд, с 11 по 16 августа 2024 года. Это главная научная конференция в области обработки естественного языка в мире.

 

Научную работу цитировали одни из самых известных исследователей эффективности искусственного интеллекта в мире, представляющие Принстонский университет и Университет Карнеги — Меллона. Почти все языковые модели в мире используют именно их наработки.

 

Суть открытия

 

В основе открытия лежит новая архитектура языковых моделей, названная ReBased. Архитектура в глубоком обучении — это общий план или структура, по которой строится нейронная сеть. Она определяет, какие типы слоев будут использованы (например, сверточные, рекуррентные или полносвязные) и как эти слои будут соединены между собой. Проще говоря, это как проект дома, где есть план этажей, комнаты и их соединения. Хорошо продуманная архитектура позволяет нейросети лучше решать определенные задачи, например распознавать изображения или понимать текст. Выбор подходящей архитектуры важен для эффективности и точности работы модели.

 

Самые распространенные языковые модели основаны на архитектуре «Трансформер», представленной в 2017 году исследователями из Google. Они хорошо зарекомендовали себя при решении практических задач, но для них требуется очень большое количество ресурсов, которые растут квадратично с удлинением текста. Для широкого практического применения необходимы менее ресурсозатратные архитектуры.

 

Наиболее успешные конкуренты трансформеров — последние SSM-модели (State Space Model, модели пространства состояний) Mamba, но они уступают по способности контекстного обучения, которое позволяет ИИ-агентам адаптироваться к новым задачам без необходимости повторного обучения.

 

В модели Based, представленной учеными Стэнфорда в декабре 2023 года, которая значительно улучшила способности контекстного обучения, специалисты T-Bank AI Research обнаружили неэффективное использование ресурсов из-за неоптимальной структуры нейросети.

 

Проведя анализ архитектуры Base, ученые из T-Bank AI Research оптимизировали механизм извлечения информации из текста, добавив новые обучаемые параметры, которые отвечают за оптимальный поиск взаимосвязей между частями текста. Это позволяет улучшить процесс его обработки и получать более точные ответы. Ученые также упростили алгоритм выделения текстовой информации, что привело к увеличению производительности, повышению качества работы с длинными текстами и улучшению контекстного обучения. В среднем понимание взаимосвязей в тексте в новой архитектуре стало лучше на 10%.

 

ReBased способна снизить издержки на использование искусственного интеллекта для специализированных задач, которые имеют конкретную область применения и требуют учета ее особенностей. Например, в медицине такой задачей может считаться классификация текстов на основе симптомов и диагнозов.

 

Новая архитектура, предложенная учеными, позволяет приблизить качество линейных моделей к трансформерам. Модели, в основе которых лежит ReBased, могут генерировать тексты с более низкими требованиями к ресурсам практически без потери качества.

 

Ученые проводили эксперименты на датасете MQAR (Multi-Query Associative Recall), который позволяет определять способность модели к контекстуальному обучению, а именно к ассоциативному запоминанию (запоминанию не связанных пар объектов), например: лицо человека — его имя.

 

Ярослав Аксенов, исследователь обработки естественного языка в T-Bbank AI Research:

«Примечательно, что параллельно с выходом нашей статьи группа исследователей из Стэнфорда выпустила исследование на эту же тему, но с другим подходом к решению. Сейчас это одна из наиболее интересных областей исследований в NLP по всему миру: трансформеры слишком медленные, но линейные модели уступают им по качеству. И мы, и ученые из Стэнфорда занимаемся поиском оптимальных архитектур. Мы ценим их вклад в развитие технологий и рады возможности участвовать в научном диалоге такого уровня».

 

В перспективе линейные модели все чаще будут использоваться в комбинации с трансформерами в качестве составной части гибридных архитектур. Такие архитектуры сочетают в себе и скорость, и высокое качество выполнения задач.

 

Подробное описание модели и результаты экспериментов доступны в статье Linear Transformers with Learnable Kernel Functions are Better In-Context Models.

 

Исходный код и дополнительные материалы можно найти на GitHub.

 

Лаборатория T-Bank AI Research

 

T-Bank Al Research — это одна из немногих российских лабораторий, которые занимаются фундаментальными научными исследованиями на базе бизнеса. Лаборатория входит в состав Центра искусственного интеллекта Т-Банка.

 

Ученые из T-Bank Al Research исследуют наиболее перспективные области ИИ: обработку естественного языка (NLP), компьютерное зрение (CV) и рекомендательные системы (RecSys). По результатам экспериментов они пишут научные статьи для наиболее авторитетных международных научных конференций: NeurIPS, ICML, ACL, CVPR и других.

 

За три года существования команды более 20 статей были приняты на крупнейшие конференции и воркшопы в области ИИ. Научные работы T-Bank Al Research цитируются учеными из университетов Беркли и Стэнфорда, а также исследовательского проекта Google по изучению искусственного интеллекта Google DeepMind.

 

Команда курирует исследовательские лаборатории T-Bank Lab в МФТИ и Omut AI в Центральном университете и помогает талантливым студентам совершать научные открытия.

 

Читайте нас там, где вам удобно: Дзен | Вконтакте | MAX | Telegram

 

 

 

 

 

Посмотреть все новости раздела "Технологии"

 

Рейтинг: 0 Голосов: 0 2395 просмотров
Комментарии (0)

Нет комментариев. Ваш будет первым!

Внимание! Все комментарии проходят ручную модерацию, если ваш комментарий не нарушает Правила, он обязательно появится в обсуждении через небольшой промежуток времени.
Опубликованные комментарии являются частными мнениями лиц, их написавших.
Редакция портала за размещенные комментарии ответственности не несет.

 

 

 

Последние новости
  Все новости

 

 

 

Популярные новости за неделю
Мост из Пермского края соединит берега Исети в центре Екатеринбурга
Мост из Пермского края соединит берега Исети в центре Екатеринбурга
5 марта 2026 - Журналист - 0 - 1340

Краснокамский ремонтно-механический завод изготовил металлоконструкции для моста через Исеть на улице Куйбышева в Екатеринбурге. Современный пешеходный мост станет частью большой реновации набережной в столице Свердловской области.

Цифры и амбиции: как небольшой цех в Прикамье планирует выдавать по 8000 дверей в месяц
Цифры и амбиции: как небольшой цех в Прикамье планирует выдавать по 8000 дверей в месяц
6 марта 2026 - Журналист - 0 - 1291

В начале марта губернатор Пермского края Дмитрий Махонин совершил рабочую поездку в Уинский муниципальный округ, где ключевым пунктом визита стало посещение деревообрабатывающего предприятия торговой компании «Сарко». Этот визит позволил не только оценить текущие мощности производства, но и обсудить перспективы развития отрасли в регионе.

Звёздное небо взамен конфет: на что пермские мужчины готовы тратиться перед 8 Марта
Звёздное небо взамен конфет: на что пермские мужчины готовы тратиться перед 8 Марта
6 марта 2026 - Журналист - 0 - 1126

В преддверии весны пермские мужчины удивили аналитиков своей романтичностью. Судя по обезличенным данным Мегафона, в феврале жители столицы Прикамья и края резко активизировали поиск небанальных презентов для своих вторых половинок. Речь идет не о банальных коробках конфет или парфюмерных наборах из ближайшего супермаркета, а о подарках, дарящих эмоции и исполняющих мечты.

МегаФон обеспечил высокоскоростным интернетом еще четыре территории Прикамья
МегаФон обеспечил высокоскоростным интернетом еще четыре территории Прикамья
5 марта 2026 - Журналист - 0 - 1109

В эпоху, когда цифровые технологии проникают во все сферы жизни, возможность оставаться на связи становится не просто удобством, а жизненной необходимостью. И если для жителей мегаполисов высокоскоростной интернет давно стал привычным фоном, то для небольших населенных пунктов его появление — настоящее событие, способное изменить уклад жизни. МегаФон сделал такой подарок жителям четырех населенных пунктов Пермского муниципального округа. В поселках Кукуштан и Юго-Камский, а также в деревнях Аникино и Глушата заработало новое телеком-оборудование, и теперь частные дома, садовые товарищества и даже окрестные территории оказались в зоне уверенного приема.

Конец эпохи «серых» симок: что изменилось на рынке мобильной связи за год
Конец эпохи «серых» симок: что изменилось на рынке мобильной связи за год
5 марта 2026 - Журналист - 0 - 958

Борьба с киберпреступностью в России вышла на новый уровень. То, что еще пару лет назад казалось технически сложным и труднодостижимым, сегодня становится привычной реальностью. И цифры, которые озвучил глава МВД Владимир Колокольцев на расширенной коллегии министерства, говорят сами за себя — работа проделана колоссальная. Только за прошедший год из теневого оборота было выведено более трех миллионов сим-карт, а количество ликвидированных подпольных сим-банков перевалило за тысячу восемьсот. Плюсом к этому совместно с Национальным координационным центром по компьютерным инцидентам удалось заблокировать порядка полутора тысяч иностранных IP-адресов, которые использовались для противоправных действий.

 

Новые статьи
Где купить эфирные масла для бани и сауны: полный гид для ценителей настоящего пара
Где купить эфирные масла для бани и сауны: полный гид для ценителей настоящего пара
10 марта 2026 - Журналист - 0 - 276
Ищете, где купить качественные эфирные масла для бани в Минске? Узнайте, как выбрать натуральный продукт, обзор лучших мест покупки и правила использования в сауне. Полезный гид для ценителей...
Почему важна теплоизоляция в водонагревателе и как ее проверить
Почему важна теплоизоляция в водонагревателе и как ее проверить
5 марта 2026 - Журналист - 0 - 608
Вы когда-нибудь замечали, что бойлер включается каждые 15–20 минут, даже если горячей водой никто не пользуется? Кажется, что техника работает исправно, но счета за электричество неумолимо...
MICE «под ключ»: Почему будущее за комплексными коммуникациями, а не разовыми акциями
MICE «под ключ»: Почему будущее за комплексными коммуникациями, а не разовыми акциями
5 марта 2026 - Журналист - 0 - 371
Современный бизнес давно перестал воспринимать корпоративные события просто как повод накрыть столы или отправить коллектив на шашлыки. Деловые встречи, конференции и выездные сессии превратились...
«Свеза» внедряет системы машинного зрения на комбинате в Прикамье
«Свеза» внедряет системы машинного зрения на комбинате в Прикамье
5 марта 2026 - Журналист - 0 - 635
Лесопромышленная группа «Свеза» внедрила на комбинате в Уральском системы машинного зрения, автоматизированную приемку сырья и цифровой контроль лесозаготовок. Проект стал частью...

 

 

 

 






 

Top.Mail.Ru
Top.Mail.Ru  

Основные разделы
Новости | Новости Перми | Публикации | Фото | Справка | Вопросы и ответы |
Информация
О проекте | Правила сайта | Реклама | Партнеры | Сообщить новость | Персональные данные |