Российская разработка A-Vibe от компании Авито заняла первое место в национальном рейтинге MERA, обойдя зарубежные аналоги от OpenAI, Google и Anthropic в категории лёгких моделей (до 10 млрд параметров).

Эта нейросеть не только лучше понимает русский язык, но и эффективнее генерирует код, поддерживает осмысленные диалоги и уже помогает пользователям Авито — например, создаёт продающие описания товаров и ускоряет переговоры в чатах. В планах компании — внедрить ещё 20 сценариев использования до конца года, а в перспективе даже открыть код модели для всех.
Почему A-Vibe оказалась лучше мировых аналогов?
Команда Авито сделала ставку на оптимизацию архитектуры и качественные данные, что позволило добиться высокой эффективности при относительно небольшом размере модели.
Ключевые преимущества:
- Скорость: обработка запросов даже в условиях высокой нагрузки.
- Масштабируемость: технология адаптирована под нужды платформы с миллионами пользователей.
- Экономическая эффективность: инвестиции в GenAI составят 12 млрд рублей, а ожидаемая прибыль — более 21 млрд к 2028 году.
«Мы доказали, что компактная модель может быть не менее эффективной, чем крупные аналоги, если правильно подобрать данные и архитектуру», — подчеркнул Андрей Рыбинцев, старший директор по данным и аналитике Авито.
Как A-Vibe обошла GPT-4o, Claude 3.5 и другие модели?
В тестах MERA нейросеть от Авито показала рекордные результаты в нескольких категориях:
- Генерация кода — на 25% лучше, чем Gemini 1.5 (8B).
- Ведение диалога — на 32% точнее, чем Llama 3.1 (405B).
- Анализ текста — на 23% превзошла Claude 3.5 Haiku.
Тестирование включало задачи разной сложности — от базового понимания контекста до сложных лингвистических вызовов.

Секреты разработки: как A-Vibe стала лидером
Изначально Авито использовала открытую модель, но столкнулась с проблемами:
- Русский язык составлял менее 1% обучающих данных.
- Точность и скорость работы с кириллицей оставляли желать лучшего.
Решение:
- Собственный токенизатор — ускорил обработку русского текста в 2 раза.
- Глубокая русификация — улучшила понимание нюансов языка.
Благодаря этим изменениям A-Vibe стала лучшей в своём классе для работы с русскоязычным контентом, поддерживая до 32 тыс. токенов контекста.
Будущее A-Vibe: открытый код и развитие экосистемы
Авито рассматривает возможность открытого доступа к модели, что может дать импульс развитию российского ИИ:
- Малый бизнес получит доступ к передовым технологиям без огромных затрат.
- Университеты смогут использовать её в образовательных программах.
- Разработчики создадут новые сервисы на её основе.
«Это не только вклад в отрасль, но и шанс получить обратную связь для улучшения наших решений», — отметила Анастасия Рысьмятова, руководитель разработки больших языковых моделей Авито.
Что такое MERA?
MERA — первый российский бенчмарк для оценки языковых моделей, разработанный при поддержке Альянса ИИ, технологических компаний и научных организаций. Он тестирует не только лингвистические способности ИИ, но и его понимание культурного контекста.
Вывод
A-Vibe доказала, что даже небольшая, но хорошо оптимизированная модель может превзойти гигантов вроде OpenAI и Google — особенно когда дело касается русского языка. А с планами по открытому доступу её влияние на рынок может стать ещё значительнее.
«Теперь у российского ИИ есть свой чемпион» — и это только начало. ?