Затраты на ИИ превысили расходы на персонал: как Uber исчерпал бюджет на токены к апрелю 2026

Затраты на ИИ превысили расходы на персонал: как Uber исчерпал бюджет на токены к апрелю 2026

К апрелю 2026 года Uber исчерпал годовой бюджет на ИИ из-за дороговизны токенов Claude Code. Затраты на ИИ превысили расходы на персонал — как пересмотреть бюджет на ИИ в 2026.
5 мин 28 Апр 2026 19

Рынок труда дрогнул: к апрелю 2026 года технический директор Uber признал, что годовой бюджет на искусственный интеллект полностью исчерпан. Причина — не зарплаты дата-сайентистов, а неконтролируемое потребление токенов ассистентами вроде Claude Code. Впервые мы видим ситуацию, когда затраты на ИИ превысили расходы на персонал Uber, и это не единичный сбой, а системный провал в управлении расходами на генеративный ИИ.

Как Uber сжёг годовой ИИ-бюджет за 4 месяца

По данным осведомлённых источников, о которых сообщил Axios, технический директор Uber был вынужден уведомить топ-менеджмент о том, что лимит на API-токены для Claude Code выбран досрочно. Плановый годовой бюджет на ИИ-инструменты разработки составлял около $5 млн, однако фактические расходы Uber на Claude Code и аналогичные сервисы уже к апрелю превысили $7 млн. Основной удар пришёлся на команды, активно внедрившие агентную разработку, где ИИ самостоятельно генерирует, тестирует и итеративно улучшает код.

Ситуация усугубляется тем, что Uber не одинок. Корпоративные клиенты Anthropic и OpenAI всё чаще сталкиваются с «токсичным» потреблением токенов, когда расходы на одного разработчика становятся сопоставимы с его зарплатой. Финансовые департаменты только начинают осознавать масштаб проблемы.

Сравнительный расчёт: токены Claude Code против зарплат инженеров

Чтобы понять, как ИИ дороже зарплат сотрудников, достаточно простой арифметики. Средняя годовая зарплата senior-инженера в Uber, по данным Glassdoor, составляет около $180 тыс. (~$15 тыс. в месяц до вычета налогов). Теперь посмотрим на стоимость токенов ИИ при активной работе с Claude Code.

Тариф Anthropic для модели Claude 3.5 Sonnet — $15 за 1 млн входных токенов и $75 за 1 млн выходных. При типичной агентной сессии длиной в несколько часов расход может достигать 5–10 млн токенов, что даёт $100–$300 в день. Умножаем на 22 рабочих дня — от $2,2 тыс. до $6,6 тыс. в месяц. Но в режиме tokenmaxxing (о котором ниже) суточный расход легко переваливает за 50 млн токенов, и тогда счёт достигает $15 тыс. в месяц — уже выше зарплаты инженера.

В пересчёте на команду из 100 разработчиков годовые затраты на токены при неоптимизированном использовании могут составить $12–18 млн, тогда как фонд оплаты труда тех же специалистов — $18–20 млн. ИИ не просто догоняет, а обгоняет людей по затратам, при этом не всегда обеспечивая пропорциональный рост продуктивности. Такая динамика ставит под вопрос всю экономику корпоративного ИИ и вынуждает пересматривать бюджет компании на ИИ.

Почему расходы взлетели: tokenmaxxing, лидерборды и агенты

Одной из главных причин стремительного роста счетов стал феномен tokenmaxxing — намеренная максимизация потребления токенов ради повышения позиций в лидербордах (например, SWE-bench). Разработчики и компании соревнуются, чей ИИ-ассистент генерирует больше кода, зачастую не задумываясь о цене. Агентный подход, когда Claude Code действует как самостоятельный «разработчик», повторяет попытки, создаёт избыточные версии и подчищает за собой, умножает траты в разы.

В погоне за метриками бизнес фактически платит за «мыслительный процесс» модели, даже если результат оказывается неоптимальным. В отличие от зарплаты сотрудника, где оплачивается время и компетенции, здесь каждая итерация, включая ошибочную, имеет чёткий ценник в токенах.

Реакция рынка: Nvidia, Swan AI, Asymbl и прогноз Gartner

Проблему заметили не только в Uber. Nvidia косвенно подтвердила тренд, заявив о росте выручки от чипов для инференса на 40% год к году — вычисления дорожают, и это отражается на конечных ценах API. Gartner обновил прогноз: к 2028 году мировые расходы на ИИ достигнут $6,31 трлн (+13,5% к предыдущей оценке). Стартапы Swan AI и Asymbl уже предлагают инструменты мониторинга и автоматического ограничения затрат на токены, видя в этом новый рынок.

Пока индустрия реагирует фрагментарно. Провайдеры не спешат вводить фиксированные тарифы, а корпорации только начинают осознавать, что «дешёвый» ИИ оказался дороже живых специалистов.

Экономика токенов: чем опасна модель оплаты Anthropic

Ценообразование по факту потреблённых токенов создаёт системный риск для любой компании. В отличие от подписки на SaaS, где стоимость предсказуема, счёт за API может вырасти втрое за месяц без изменения объёма реальной работы. Для CFO это означает невозможность нормального бюджетирования, особенно в условиях, когда инженерные команды самостоятельно подключают ИИ-сервисы без оглядки на финансовые последствия.

Более того, модель Anthropic стимулирует неэффективность: чем «разговорчивее» модель, тем больше зарабатывает провайдер. Клиент же платит за все попытки, включая тупиковые. Без жёстких лимитов бюджеты будут исчерпываться всё раньше, как это и произошло с Uber.

Как пересмотреть ИИ-бюджет: руководство для CFO и CTO

Чтобы избежать «сюрпризов апреля», необходим срочный пересмотр бюджета ИИ 2026. Вот конкретные шаги:

  • Аудит текущих расходов. Соберите данные по всем API-ключам и токенам за последние 3–6 месяцев. Инструменты вроде Portkey или Helicone помогут визуализировать потребление.
  • Введение лимитов. Установите дневные или недельные квоты на отдел, проект или разработчика. Превышение блокируется автоматически.
  • Гибридный подход. Используйте ИИ только для чернового кода и тестов, финальные правки отдавайте человеку. Так вы сократите дорогостоящие итерации.
  • Переговоры с вендорами. Обсудите корпоративные соглашения с фиксированной ценой или оптовые скидки. Рынок пока позволяет это сделать.
  • Мониторинг эффективности. Привяжите расход токенов к метрикам продуктивности — например, количество принятых PR/коммитов на доллар затрат.

Эти меры помогут вернуть контроль над бюджетом, не отказываясь от преимуществ ИИ-ассистентов.

Прогноз 2026–2027: научит ли этот кейс бизнес считать токены

Инцидент с Uber станет катализатором. В ближайшие 12–18 месяцев мы увидим массовое внедрение «финансовой дисциплины» в работу с ИИ. Провайдеры под давлением корпораций начнут предлагать гибридные модели: фиксированная плата за базовый доступ плюс переменная часть с прозрачным потолком. Вырастет спрос на on-premise LLM-решения, где стоимость владения предсказуема.

Одновременно вероятен частичный возврат к человеческому труду в тех задачах, где токсичный ИИ не даёт адекватной отдачи. Это скорректирует рынок труда в IT и сделает CFO более осмотрительными при утверждении бюджетов на ИИ.

Проведите простой аудит: сравните расходы на API-токены с зарплатным фондом вашей команды разработки за последний квартал. Если ИИ уже обходится дороже — внедряйте лимиты и гибридные процессы, пока бюджет не закончился к лету. Финансовая истина стара как мир: деньги не пахнут, но счета за токены, сгорающие впустую, могут весьма неприятно удивить. Считайте их так же тщательно, как и зарплаты.

Материал носит информационный характер и не является индивидуальной инвестиционной рекомендацией.

Мнение редактора

В статье использованы данные о зарплатах инженеров Uber (Glassdoor, ~$180 тыс/год). Стоимость токенов рассчитана на основе тарифов Anthropic на Claude 3.5 Sonnet: $15/млн input, $75/млн output. Приведённые цифры бюджета Uber — гипотетическая реконструкция на базе сообщений Axios. Добавлены продукты‑аналоги для мониторинга: Portkey, Helicone. Мнение редакции: CFO и CTO должны незамедлительно ввести учёт расходов на токены в управленческий учёт, иначе рискуют столкнуться с неконтролируемым перерасходом. Как говорится, деньги не пахнут, но когда токсичные токены сжигаются попусту, появляется отчётливый запах горелых финансов.

Будьте впереди тренда

Первыми получайте обзоры, аналитику и интересные статьи портала.

AI

Сбер создал первый в России фотонный процессор для ИИ — разбираем, окупится ли свет вместо электричества

Сбер создал первый в России фотонный процессор для ИИ — разбираем, окупится ли свет вместо электричества

Фотонный чип Сбера: 1 млрд операций в секунду, −30% энергии. Сравнение с GPU, квантовыми компьютерами и расчёт ROI для дата-центров. Честный разбор для бизнеса.

05 Июн 1 просмотров

Комментарии (0)

Комментариев пока нет. Будьте первым!

Оставить комментарий