AI-агенты упёрлись в стоимость токенов
Когда счётчик стал заметен
Microsoft начала сворачивать внутренние лицензии на Claude Code и пересаживает разработчиков на GitHub Copilot CLI. Об этом пишут The Verge и Fortune. Сама по себе замена одного инструмента на другой — вещь рядовая, но тут интереснее фон: компаниям вдруг стало важно, сколько на самом деле стоит ежедневная работа AI‑агентов, и суммы оказались отрезвляющими.
Инструмент Anthropic быстро прижился внутри Microsoft после внутреннего запуска, разработчикам нравилось. Однако масштаб использования упёрся в деньги. Партнёрство Microsoft с Anthropic через Foundry, по сообщениям тех же СМИ, никуда не девается — просто бизнес решил, что агентный кодинг в таком объёме обходится слишком дорого.
«Обычный чат — это запрос и ответ. Агент работает иначе: читает файлы, выстраивает план, правит код, запускает тесты, ловит ошибки, опять исправляет и повторяет цикл. Каждый такой шаг — новые токены. Поэтому счета растут не линейно, а рывками.»
Один разработчик пользуется ассистентом умеренно, другой запускает длинные автономные сессии, где модель часами перебирает варианты. Внешне в обоих случаях «помощник пишет код», а для финансистов — непрерывный поток расходов на вычисления.
Характерная деталь: GitHub Copilot с 1 июня 2026 года сам переходит на usage‑based billing. Вместо прежних premium request units вводятся GitHub AI Credits, которые считаются по input, output и cached tokens с привязкой к конкретной модели. И это логично: Copilot уже давно не только автодополнение в редакторе, а полноценная платформа для чата, ревью, CLI и агентных сценариев. Фиксированная цена за рабочее место всё хуже отражает реальную нагрузку.
Microsoft в этой ситуации не одинока. Вокруг Uber тоже обсуждали похожий сюжет: бюджет на AI‑инструменты израсходовали слишком быстро, а расходы на одного инженера могли отличаться в разы в зависимости от стиля работы. Детали там туманные, но общий вектор уже не спутаешь.
«AI‑инструменты перестали быть пакетом софта по подписке и всё больше напоминают облачную инфраструктуру: сколько съел, столько и заплатил.»
Теперь компаниям приходится смотреть не только на скорость генерации кода, но и на экономику каждого сценария. Агент может сэкономить час инженера, а может сжечь кучу токенов на попытки, которые потом всё равно нужно перепроверять человеку. Отсюда появляются новые привычки:
бюджеты по командам,
лимиты,
что‑то вроде FinOps для AI,
мониторинг дорогих моделей поведения,
правила, когда агенту разрешено работать автономно, а когда лучше остановиться и спросить человека.
Microsoft не отказывается от AI‑разработки. Она просто переводит энтузиазм в управляемую бухгалтерию.
Пока AI‑инструменты были экспериментом, все смотрели на вау‑эффект и скорость прототипов. Теперь агентные сценарии стали достаточно массовыми, чтобы упереться в бюджет, и главный вопрос сменился: не «может ли ИИ писать код», а «сколько стоит этот код после всех попыток, токенов и проверок».
Итог
Microsoft оказалась в зеркальной ситуации: она продаёт облачную AI‑инфраструктуру, а сама внутри вынуждена контролировать аппетиты к токенам. Это не провал агентов, а нормальный этап после первого восторга. Дальше будет меньше безлимита и больше учёта.
Источник: Fortune
Подписка
Сейчас: Не подписан
Участники
0Видимых участников обсуждения пока нет.
Лучшие комментарии
Лучшие комментарии появятся после первых оценок и ответов.
Активные ветки
Активные ветки появятся, когда у корневых комментариев будут ответы.
Комментарии
0 всегоНаписать комментарий
Войдите, чтобы участвовать в обсуждении.
Комментариев пока нет. Можно начать ветку первым.
ymki
Цитаты из этого топика
Последние цитаты, созданные из текста топика и его комментариев.