«Яндекс» запустил более дешёвую ИИ-модель для бизнеса

Alice AI LLM Flash ориентирована на массовые бизнес-задачи: тексты, документы, поддержку и внутренние базы знаний.

28 мая «Яндекс» представил новую языковую модель Alice AI LLM Flash, ориентированную на корпоративных клиентов и уже доступную через Yandex AI Studio. Главный козырь — цена: по заявлению компании, использование Flash может обходиться бизнесу почти в 5 раз дешевле предыдущих ИИ-решений. При этом это не «урезанная» версия, а модель, специально заточенная под массовые рабочие сценарии.

Зачем бизнесу дешёвая модель

За последний год запросы компаний заметно сместились: рынку нужны не только самые мощные модели, а понятные по деньгам инструменты для потока однотипных операций. По данным Яндекса, почти 60% B2B-запросов к его ИИ-моделям приходятся именно на такие задачи — разбор документов, типовые ответы, структурирование информации, поиск по базам знаний и обработку обращений. В тарифах AI Studio цена указана предельно конкретно: 0,1 ₽ за 1000 входящих токенов и 0,2 ₽ за 1000 исходящих. Если модель крутится на потоке, даже такая мелкая разница быстро превращается в ощутимую строку бюджета.

Что с качеством

Яндекс приводит собственные тесты: Alice AI LLM Flash в 56% случаев превосходит GPT-5.4 mini по качеству решения бизнес-задач. В диалогах показатель взлетает до 73%, в обобщении и структурировании текста — 66%, в поиске данных по файлам — 61%.

«Модель оптимизирована под массовые корпоративные задачи».

Формулировка важная: Flash не пытаются продать как универсального лидера для всего подряд. Это инструмент, который можно встроить в поддержку, документооборот, модерацию, внутренний поиск и клиентские сервисы. К бенчмаркам, впрочем, стоит отнестись спокойно — сравнения проводила сама компания, и реальную пользу бизнес всё равно будет проверять на своих данных и процессах.

Длинный контекст приходит следом

Одновременно Яндекс открыл в Yandex AI Studio доступ к DeepSeek V4 Flash — первой, по оценке компании, модели в российском облаке с контекстным окном 1 млн токенов. На практике это несколько сотен страниц документации, огромная переписка или целая база знаний — примерно 700–800 тысяч слов. Там, где короткого контекста уже не хватает (анализ договоров, длинных инструкций, технических документов), такая модель становится нужной. При этом новая версия в 1,5 раза дешевле предыдущей DeepSeek V3.2.

Два слоя для разных задач

Ход Яндекса получился двойным: собственная Flash для массовых и недорогих задач, а внешняя DeepSeek V4 Flash — для длинного контекста и сложной работы с большими массивами текста. Корпоративный ИИ постепенно перестаёт быть спором о том, чья модель «самая сильная». Всё упирается в экономику: какую модель выгодно гонять на потоке, где нужен километровый контекст, а где достаточно быстрого и дешёвого исполнителя.

Бизнесу теперь важны не только красивые тесты, но и стоимость тысячи запросов, скорость ответа и возможность обработать документы без лишних затрат. Если Flash действительно даст приемлемое качество при меньшей цене, часть ИИ-сценариев станет ближе к обычной автоматизации. А там, где важны сотни страниц контекста, компании наконец смогут тестировать такие задачи без отдельной инфраструктурной головной боли. Итоговую ценность, впрочем, покажут не внутренние сравнения, а реальные пилоты у заказчиков.

0Счет: 020Просмотры: 200Комментарии: 00Цитаты: 00Посты-цитаты: 00Оценки: 0

Подписка

Сейчас: Не подписан

Подписка: Не подписан
Войдите, чтобы подписаться на обсуждение.

Участники

0

Видимых участников обсуждения пока нет.

Лучшие комментарии

Лучшие комментарии появятся после первых оценок и ответов.

Активные ветки

Активные ветки появятся, когда у корневых комментариев будут ответы.

Комментарии

0 всего
Написать комментарий

Войдите, чтобы участвовать в обсуждении.

Комментариев пока нет. Можно начать ветку первым.

ymki

Цитаты из этого топика

Последние цитаты, созданные из текста топика и его комментариев.

Этот топик пока не цитировали.