Claude Code /goal: автономная работа Claude до результата
Anthropic добавил /goal в Claude Code: команда задаёт условие, а маленькая модель проверяет каждый ход и продолжает работу до результата. Разбираю, что это меняет на практике.
Anthropic добавил /goal в Claude Code: команда задаёт условие, а маленькая модель проверяет каждый ход и продолжает работу до результата. Разбираю, что это меняет на практике.
Anthropic добавила Agent View в Claude Code — одно окно для управления параллельными сессиями, фоновыми задачами и контролем агентов прямо в терминале.
Google переосмысляет ноутбуки после 15 лет с Chromebook: новая категория Googlebook на Android и ChromeOS с Gemini внутри. Релиз осенью 2026.
Telegram превратил мессенджер в рантайм для AI-агентов: вызывай бота через @ в любом чате, боты общаются между собой, ответы стримятся.
Google выпустил Multi-Token Prediction drafters для Gemma 4. Та же модель, та же точность, в три раза быстрее на одном железе.
Anthropic подписал партнёрство со SpaceX и забирает весь compute дата-центра Colossus 1: это 300 МВт мощности и 220 000 NVIDIA GPU. Параллельно компания удвоила лимиты Claude Code и подняла rate limits API для Opus.
AI-агенты вроде Claude Code хорошо работают с CLI. Разбираю пример CloudWatch Insights tool и почему иногда обычный терминальный интерфейс лучше MCP.
OpenAI выпустила GPT-5.5 и GPT-5.5 Pro. Обгоняет Claude Opus 4.7 на Terminal-Bench (82,7% vs 69,4%), 400K контекст в Codex. Что реально изменилось.
OpenAI показала ChatGPT Images 2.0 — генератор картинок, который «думает» перед рисованием, аккуратно пишет текст на русском и собирает сложные журнальные композиции.
Nous Research выкатили Hermes Agent — open-source агент на сервер с памятью между сессиями, субагентами и каналами в Telegram/Slack/Discord. Разбираю фичи и сравниваю с OpenClaw.
Бенчмарк KillBench от White Circle протестировал 15 топовых LLM на 1,35 млн сценариев «кого спасти». Bias нашли у каждой модели, а структурированный вывод почти обнуляет safety.
Разбираемся в Claude Design — новом продукте Anthropic Labs. Как промпт превращается в прототип, что такое handoff в Claude Code и почему акции Figma просели на 7% после анонса.
Claude
Forrest Chang собрал в один CLAUDE.md файл 4 принципа Карпатого против переусложнения, додумывания и drive-by-правок. 48к звёзд за пару месяцев.
Claude
Новый флагман Anthropic: сильнее в сложных задачах, лучше видит картинки, появились xhigh и /ultrareview. Разбираю, что поменялось.
Claude
Anthropic запустила Managed Agents. Готовый агентный harness в облаке: контейнеры, инструменты, стриминг. Разбираемся, что это и зачем.
AI
Open-source система памяти для AI-агентов от Миллы Йовович. 96.6% recall на LongMemEval, полностью локальная, бесплатная, с MCP-интеграцией.
LLM
GLM-5.1 набрала 45.3 балла в кодинг-бенчмарке — всего 2.6 балла от Claude Opus 4.6. Обучена на чипах Huawei, скоро выйдет в open source под MIT.
LLM
Alibaba выпустила Qwen 3.6-Plus с контекстом в 1 миллион токенов. Модель обходит Claude на Terminal-Bench и претендует на лидерство в агентном кодинге.
Google выпустил Gemma 4 — четыре открытые модели от 2B до 31B параметров на технологиях Gemini 3. 31B занимает третье место среди открытых моделей, а E2B работает на Raspberry Pi за 1.5 ГБ памяти.
Новости
Microsoft представила MAI-Transcribe-1, MAI-Voice-1 и MAI-Image-2. Собственные модели, агрессивные цены и явный курс на независимость от OpenAI.
Claude
Anthropic добавила Computer Use в Claude Cowork и Code. AI кликает, скроллит и управляет приложениями, а Dispatch позволяет давать задания с телефона.
Новости
Google выпустила лучшую аудиомодель в линейке Gemini. Быстрые ответы, понимание интонаций и расширение Search Live на 200+ стран.
Новости
Anthropic запустил auto mode в Claude Code: вместо ручного одобрения каждого действия AI-классификатор сам решает, безопасно ли выполнение.
Разработка
Bassim Eledath предложил фреймворк из 8 уровней агентного инжиниринга. От автокомплита в Copilot до автономных команд агентов, которые координируются между собой без человека.