Инженеры OpenAI не пишут код!

Шервин Ву из OpenAI рассказал, что 95% инженеров на Codex, а инженеры теперь управляют флотами агентов. Разбираю 5 ключевых инсайтов и добавляю свой опыт.

Инженеры OpenAI не пишут код!
TL;DR: Шервин Ву из OpenAI рассказал, что 95% инженеров компании используют Codex ежедневно, а 100% пулл-реквестов проходят AI-ревью. Я послушал полуторачасовое интервью и выделил пять вещей, над которыми стоит задуматься каждому разработчику.

На прошлой неделе вышло интервью Шервина Ву, главы инженерии API-платформы OpenAI, у Ленни Рачитски. Шервин — человек, чья команда строит инфраструктуру, на которой работает чуть ли не вся AI-индустрия. И то, что он рассказывает о внутренней кухне OpenAI, заставляет по-новому посмотреть на собственную рутину.

Я выделил пять мыслей и добавил свои наблюдения как человек, который последние полгода активно работает с AI-агентами.

Инженеры управляют агентами, а не пишут код

Главная цифра: 95% инженеров OpenAI используют Codex каждый день. 100% пулл-реквестов проходят ревью через Codex. Инженеры, которые активно используют агентов, открывают на 70% больше PR, и этот разрыв растёт.

Шервин описывает это через метафору из книги SICP 1980 года: программисты — это волшебники, а код — заклинания. Сейчас это уже не метафора. Ты буквально говоришь агенту, что нужно сделать, и он идёт делать.

Мне это знакомо. Я работаю с Claude Code и запускаю параллельно несколько агентов на разные задачи. Ощущение действительно похоже на управление командой: ты не кодишь, ты ставишь задачи, проверяешь результат, направляешь. Иногда ловишь себя на мысли, что за последний час не написал ни строчки руками, но при этом закрыл кучу задач.

Шервин сравнивает текущий момент с «Учеником чародея» из Фантазии Диснея: Микки нашёл шляпу волшебника, запустил мётлы работать, а потом всё вышло из-под контроля. Мысль понятна: нужно понимать, что делаешь. Сениорность теперь не в скорости набора кода, а в умении формулировать задачи и не давать агентам уйти в сторону.

100% кодовой базы через AI

Внутри OpenAI есть команда, которая проводит эксперимент: их кодбейз на 100% написан Codex. Когда агент не справляется, нельзя откатиться к ручному коду.

Звучит как безумие? Может быть. Но именно из такого безумия рождаются лучшие практики. Я начал подобный эксперимент уже как пару месяцев назад и именно в таком подходе ты можешь научиться управлять агентом и понимать как это делать эффективно.

Когда агент не может выполнить задачу, проблема почти всегда в контексте. Не хватает документации, не описаны конвенции, «племенное знание» осталось в головах разработчиков. Решением является записать это знание в MD-файлы, комментарии, структуру проекта.

Я это подтверждаю. У меня есть CLAUDE.md с подробными инструкциями, скилл-файлы для повторяющихся задач, и разница между «агент делает что-то случайное» и «агент делает именно то, что нужно» — это 30 минут, потраченных на документацию. Те 30 минут, которые окупаются за первый же запуск.

Не один стартап на миллиард, а тысячи на $10 млн

Шервин берёт известную идею Сэма Альтмана про one-person billion-dollar startup и разворачивает в неожиданную сторону.

Стартап одного человека на миллиард — это, может, и случится. Но интереснее вторичные эффекты. Если один человек может создать компанию на миллиард, значит один человек легко создаёт бизнес на $10 млн. Для конкретного человека $10 млн — это «set for life», хватит на всю жизнь. И таких бизнесов будут десятки тысяч.

Причём чтобы «стартап на миллиард» работал, ему нужна экосистема из сотен маленьких компаний: поддержка для подкастеров, CRM для фрилансеров, бухгалтерия для онлайн-школ. Каждый такой инструмент — это тоже стартап одного-двух человек.

По его словам, мы входим в золотой век B2B SaaS. Не потому что появится один гигант, а потому что стоимость создания софта падает к нулю, и теперь любую нишу можно занять. По данным Benzinga, аналитики тоже подхватили эту идею Шервина и обсуждают её как серьёзный тренд.

Мне эта идея нравится больше, чем хайп вокруг «one-person unicorn». Один человек на миллиард — это байка для заголовков. Тысячи людей, которые строят нишевые инструменты и нормально зарабатывают, — это реальная экономика. И она уже начинает формироваться.

Почему у большинства компаний минус от AI

Шервин прямо говорит: многие AI-внедрения в компаниях приносят отрицательный ROI. И объясняет почему.

Кремниевая долина живёт в пузыре. Все на X обсуждают MCP-серверы, skills-файлы, prompt engineering. А обычный сотрудник в обычной компании даже не понимает, как задать нормальный вопрос ChatGPT. «Я разговариваю с этими людьми, и они задают моделям самые базовые вопросы», — говорит Шервин.

Паттерн провала выглядит так: руководство решает «мы теперь AI-first», покупает лицензии, вписывает в KPI «используй AI». Но нет ни одного человека внутри, который бы реально разобрался в технологии и показал коллегам, как её применять.

Рецепт от Шервина: найти внутри компании Tiger team, людей, которые горят технологией. Часто это не программисты, а технически подкованные люди из других отделов — «Excel-волшебники», как он их называет. Дать им свободу экспериментировать и делиться знаниями. Top-down без bottoms-up не работает.

Это объясняет огромный разрыв между тем, что мы видим в Twitter, и тем, что происходит в реальности. Мы обсуждаем мультиагентные системы, а 90% компаний не могут нормально настроить чат-бот для поддержки.

Модели съедят твой скаффолдинг

Последний тезис, который мне запомнился. Шервин цитирует Николаса из FinTool: «The models will eat your scaffolding for breakfast».

Вот как это работало в последние годы. В 2022 все вкладывались в vector stores и RAG-пайплайны, потому что модели плохо работали с контекстом. Модели научились — и вся эта обвязка стала менее нужна. В 2024 все строили agent frameworks, потому что модели не могли сами оркестрировать задачи. Модели подтянулись — фреймворки упростились. Сейчас модно делать skills-файлы и context management. Через год модели, вероятно, справятся и без этого.

Совет: строй продукт, который работает на 80% с текущими моделями, и жди, когда следующее обновление закроет оставшиеся 20%. Стартапы, которые так делали, взлетели. Те, кто строил вокруг текущих ограничений — потеряли время на скаффолдинг, который модели потом «съели на завтрак».

Не уверен, что с этим можно согласиться на 100%. Какой-то скаффолдинг нужен прямо сейчас, чтобы продукт работал прямо сейчас. Но стратегически — да, ставить на улучшение моделей безопаснее, чем ставить на то, что текущие ограничения останутся навсегда.

Но есть нюанс

При всём уважении к Шервину, стоит помнить: он работает в OpenAI. Его команда строит Codex. Когда он говорит «95% наших инженеров на Codex», это OpenAI с лучшими моделями, инженерами мирового уровня и продуктом, который они сами создали.

В среднем стартапе или энтерпрайзе картина другая. Модели хуже справляются с legacy-кодом, нестандартными стеками, бизнес-логикой без документации. Я сам регулярно сталкиваюсь с ситуацией, когда агент уверенно делает не то, и потом 20 минут разбираешь, что пошло не так. Это прямо скажу происходит не часто, но с таким до сих пор сталкиваешься даже с использованием Opus 4.6.

И метрика «на 70% больше PR» — это про количество, не про качество. Больше PR — не обязательно больше ценности. Иногда одна правильная архитектурная идея стоит сотни мелких коммитов.

Итого

Интервью Шервина Ву — это взгляд из центра событий. Не всё из этого применимо за пределами OpenAI, но направление понятно: инженеры будут всё меньше писать код руками и всё больше управлять AI-агентами.

Что я вынес для себя:

  1. Документируй всё. MD-файлы, конвенции, правила — это топливо для агентов
  2. Учись формулировать задачи, а не писать код. Промпт-инженерия для агентов — это новый навык. Новый обязательный навык!
  3. Не строй вокруг ограничений. Модели улучшаются быстрее, чем ты обкладываешь их костылями

Через пару лет мы оглянемся на этот момент и скажем: «Вот тогда всё и поменялось». Или не скажем — AI-прогнозы имеют свойство не сбываться)

Что ещё почитать