«Яндекс» запустил более дешёвую ИИ-модель для бизнеса
28 мая «Яндекс» представил новую языковую модель Alice AI LLM Flash, ориентированную на корпоративных клиентов и уже доступную через Yandex AI Studio. Главный козырь — цена: по заявлению компании, использование Flash может обходиться бизнесу почти в 5 раз дешевле предыдущих ИИ-решений. При этом это не «урезанная» версия, а модель, специально заточенная под массовые рабочие сценарии.
Зачем бизнесу дешёвая модель
За последний год запросы компаний заметно сместились: рынку нужны не только самые мощные модели, а понятные по деньгам инструменты для потока однотипных операций. По данным Яндекса, почти 60% B2B-запросов к его ИИ-моделям приходятся именно на такие задачи — разбор документов, типовые ответы, структурирование информации, поиск по базам знаний и обработку обращений. В тарифах AI Studio цена указана предельно конкретно: 0,1 ₽ за 1000 входящих токенов и 0,2 ₽ за 1000 исходящих. Если модель крутится на потоке, даже такая мелкая разница быстро превращается в ощутимую строку бюджета.
Что с качеством
Яндекс приводит собственные тесты: Alice AI LLM Flash в 56% случаев превосходит GPT-5.4 mini по качеству решения бизнес-задач. В диалогах показатель взлетает до 73%, в обобщении и структурировании текста — 66%, в поиске данных по файлам — 61%.
«Модель оптимизирована под массовые корпоративные задачи».
Формулировка важная: Flash не пытаются продать как универсального лидера для всего подряд. Это инструмент, который можно встроить в поддержку, документооборот, модерацию, внутренний поиск и клиентские сервисы. К бенчмаркам, впрочем, стоит отнестись спокойно — сравнения проводила сама компания, и реальную пользу бизнес всё равно будет проверять на своих данных и процессах.
Длинный контекст приходит следом
Одновременно Яндекс открыл в Yandex AI Studio доступ к DeepSeek V4 Flash — первой, по оценке компании, модели в российском облаке с контекстным окном 1 млн токенов. На практике это несколько сотен страниц документации, огромная переписка или целая база знаний — примерно 700–800 тысяч слов. Там, где короткого контекста уже не хватает (анализ договоров, длинных инструкций, технических документов), такая модель становится нужной. При этом новая версия в 1,5 раза дешевле предыдущей DeepSeek V3.2.
Два слоя для разных задач
Ход Яндекса получился двойным: собственная Flash для массовых и недорогих задач, а внешняя DeepSeek V4 Flash — для длинного контекста и сложной работы с большими массивами текста. Корпоративный ИИ постепенно перестаёт быть спором о том, чья модель «самая сильная». Всё упирается в экономику: какую модель выгодно гонять на потоке, где нужен километровый контекст, а где достаточно быстрого и дешёвого исполнителя.
Бизнесу теперь важны не только красивые тесты, но и стоимость тысячи запросов, скорость ответа и возможность обработать документы без лишних затрат. Если Flash действительно даст приемлемое качество при меньшей цене, часть ИИ-сценариев станет ближе к обычной автоматизации. А там, где важны сотни страниц контекста, компании наконец смогут тестировать такие задачи без отдельной инфраструктурной головной боли. Итоговую ценность, впрочем, покажут не внутренние сравнения, а реальные пилоты у заказчиков.
Подписка
Сейчас: Не подписан
Участники
0Видимых участников обсуждения пока нет.
Лучшие комментарии
Лучшие комментарии появятся после первых оценок и ответов.
Активные ветки
Активные ветки появятся, когда у корневых комментариев будут ответы.
Комментарии
0 всегоНаписать комментарий
Войдите, чтобы участвовать в обсуждении.
Комментариев пока нет. Можно начать ветку первым.
ymki
Цитаты из этого топика
Последние цитаты, созданные из текста топика и его комментариев.
Этот топик пока не цитировали.