Авито совершил прорыв: нейросеть A-Vibe признана лучшей среди компактных ИИ

Российская разработка A-Vibe от компании Авито заняла первое место в национальном рейтинге MERA, обойдя зарубежные аналоги от OpenAI, Google и Anthropic в категории лёгких моделей (до 10 млрд параметров).

Авито совершил прорыв: нейросеть A-Vibe признана лучшей среди компактных ИИ

Эта нейросеть не только лучше понимает русский язык, но и эффективнее генерирует код, поддерживает осмысленные диалоги и уже помогает пользователям Авито — например, создаёт продающие описания товаров и ускоряет переговоры в чатах. В планах компании — внедрить ещё 20 сценариев использования до конца года, а в перспективе даже открыть код модели для всех.


Почему A-Vibe оказалась лучше мировых аналогов?

Команда Авито сделала ставку на оптимизацию архитектуры и качественные данные, что позволило добиться высокой эффективности при относительно небольшом размере модели.

Ключевые преимущества:

  • Скорость: обработка запросов даже в условиях высокой нагрузки.
  • Масштабируемость: технология адаптирована под нужды платформы с миллионами пользователей.
  • Экономическая эффективность: инвестиции в GenAI составят 12 млрд рублей, а ожидаемая прибыль — более 21 млрд к 2028 году.

«Мы доказали, что компактная модель может быть не менее эффективной, чем крупные аналоги, если правильно подобрать данные и архитектуру», — подчеркнул Андрей Рыбинцев, старший директор по данным и аналитике Авито.


Как A-Vibe обошла GPT-4o, Claude 3.5 и другие модели?

В тестах MERA нейросеть от Авито показала рекордные результаты в нескольких категориях:

  • Генерация кода — на 25% лучше, чем Gemini 1.5 (8B).
  • Ведение диалога — на 32% точнее, чем Llama 3.1 (405B).
  • Анализ текста — на 23% превзошла Claude 3.5 Haiku.

Тестирование включало задачи разной сложности — от базового понимания контекста до сложных лингвистических вызовов.


Авито совершил прорыв: нейросеть A-Vibe признана лучшей среди компактных ИИ

Секреты разработки: как A-Vibe стала лидером

Изначально Авито использовала открытую модель, но столкнулась с проблемами:

  • Русский язык составлял менее 1% обучающих данных.
  • Точность и скорость работы с кириллицей оставляли желать лучшего.

Решение:

  1. Собственный токенизатор — ускорил обработку русского текста в 2 раза.
  2. Глубокая русификация — улучшила понимание нюансов языка.

Благодаря этим изменениям A-Vibe стала лучшей в своём классе для работы с русскоязычным контентом, поддерживая до 32 тыс. токенов контекста.


Будущее A-Vibe: открытый код и развитие экосистемы

Авито рассматривает возможность открытого доступа к модели, что может дать импульс развитию российского ИИ:

  • Малый бизнес получит доступ к передовым технологиям без огромных затрат.
  • Университеты смогут использовать её в образовательных программах.
  • Разработчики создадут новые сервисы на её основе.

«Это не только вклад в отрасль, но и шанс получить обратную связь для улучшения наших решений», — отметила Анастасия Рысьмятова, руководитель разработки больших языковых моделей Авито.


Что такое MERA?

MERA — первый российский бенчмарк для оценки языковых моделей, разработанный при поддержке Альянса ИИ, технологических компаний и научных организаций. Он тестирует не только лингвистические способности ИИ, но и его понимание культурного контекста.


Вывод

A-Vibe доказала, что даже небольшая, но хорошо оптимизированная модель может превзойти гигантов вроде OpenAI и Google — особенно когда дело касается русского языка. А с планами по открытому доступу её влияние на рынок может стать ещё значительнее.

«Теперь у российского ИИ есть свой чемпион» — и это только начало. ?