Cursor Cloud Agents: агенты с виртуальными машинами

Cursor выпустил облачных агентов с собственными виртуальными машинами. Теперь AI сам запускает приложения, тестирует UI и записывает видео.

Cursor Cloud Agents: агенты с виртуальными машинами
TL;DR: Cursor выкатил облачных агентов с собственными виртуальными машинами. Агент генерирует код, сам запускает приложение, кликает по кнопкам, записывает видео и создаёт готовый PR. 30% пул-реквестов внутри Cursor уже делают агенты.

До сих пор AI-агенты в IDE работали примерно так: ты даёшь задачу, агент пишет код, ты проверяешь. Но агент не видел, что получилось. Он не мог запустить приложение и потыкать кнопки. Cursor решил это изменить — и дал агентам собственные компьютеры.

Что произошло

24 февраля 2026 года Cursor представил обновление cloud agents. Каждый агент получает изолированную виртуальную машину с полноценной средой разработки. Агент может:

  • Собирать и запускать проект
  • Открывать браузер и взаимодействовать с UI
  • Записывать видео своей работы как артефакт
  • Создавать PR, готовый к мержу

Запускать агентов можно откуда угодно: десктопный Cursor, веб, телефон, Slack, GitHub. Можно даже подключиться к удалённому рабочему столу агента и порулить вручную, не выкачивая ветку к себе.

30% PR в Cursor создают агенты

Это не просто демо-фича. Команда Cursor использует облачных агентов внутри компании уже месяц, и больше 30% пул-реквестов, которые мержатся, созданы агентами.

30% PR в Cursor создаются облачными агентами

Главное изменение в подходе: вместо того чтобы нарезать задачу на мелкие кусочки и микроменеджить агента, разработчики делегируют более амбициозные задачи целиком. Агент разбирается сам.

Как это используют внутри Cursor

Вот конкретные примеры, которые привела команда.

Новые фичи

Для недавно запущенного Cursor Marketplace агенту дали задачу: добавить ссылки на исходный код для каждого компонента плагина. Агент реализовал фичу, потом сам открыл страницу плагина Prisma и прокликал все ссылки, чтобы убедиться, что они ведут на правильные файлы в GitHub. Для локального тестирования он временно отключил feature flag, а перед пушем вернул обратно. Потом ребейзнулся на main, разрулил конфликты и сквошнул коммиты.

Я не знаю, насколько это типичный результат или отобранный идеальный кейс. Но если агент действительно сам резолвит конфликты при ребейзе — это серьёзный уровень.

Воспроизведение уязвимостей

Агента запустили из Slack с просьбой: «Пожалуйста, разбери и подробно объясни эту уязвимость» — с описанием проблемы с эксфильтрацией буфера обмена.

Облачный агент Cursor воспроизводит уязвимость с кражей буфера обмена

Агент собрал HTML-страницу, эксплуатирующую уязвимость через открытый API. Поднял бэкенд-сервер, загрузил демо-страницу в браузере Cursor, скопировал тестовый UUID в буфер обмена, и продемонстрировал кражу данных. По итогу сделал скриншот с доказательством и закоммитил демо-файл.

Для security-команд это прям находка. Вместо того чтобы вручную воспроизводить баг, кидаешь описание агенту, он сам всё разворачивает и снимает доказательства.

Быстрые фиксы и тестирование UI

Мелкие задачи тоже в деле. Например, агенту дали заменить статичный лейбл «Read lints» на динамический — «No linter errors» или «Found N errors». Он реализовал, запустил Cursor, проверил оба случая (файл с ошибками и чистый файл) и записал видео.

Отдельный агент потратил 45 минут на полное тестирование cursor.com/docs — проверил сайдбар, навигацию, поиск, копирование, тему и диалог обратной связи. По сути, ручное QA, но без человека.

Чем это отличается от обычных агентов

Локальные агенты в Cursor (и в других IDE) работают на твоём компьютере. Если запустить нескольких параллельно — они начинают конкурировать за ресурсы и конфликтовать друг с другом. Облачные агенты снимают это ограничение: каждый живёт в своей изолированной VM.

Но главное тут в замкнутом цикле. Агент написал код, собрал, запустил, протестировал, починил, записал результат. И только потом отдал тебе PR с видео, где видно, что всё работает. Никакого «посмотри мой первый черновик».

Что дальше

Cursor описывает будущее как «self-driving codebases» — кодовые базы на автопилоте. Агенты будут мержить PR, управлять раскатками и мониторить продакшен. Ближайший фокус — координация работы нескольких агентов и модели, которые учатся на прошлых запусках.

Мне кажется, это пока больше маркетинговое видение, чем реальность. Но направление понятно: разработчик всё меньше пишет код руками и всё больше ставит задачи и решает, что едет в продакшен.

Стоит ли пробовать

Если ты уже пользуешься Cursor — попробуй запустить облачного агента на какой-нибудь некритичной задаче. Cursor предлагает начать с onboarding, где агент сам настроится и запишет демо.

Если ты на Claude Code или Codex, тоже стоит посматривать. Облачные VM для агентов — логичный следующий шаг, и конкуренты наверняка пойдут тем же путём.

Что ещё почитать