Claude Code
Dynamic workflows в Claude Code: сотни агентов разом
Anthropic запустила dynamic workflows: Claude сам пишет оркестратор и гоняет сотни субагентов параллельно. Разбираю, кому это реально нужно и сколько стоит по токенам.
Claude
Чем Claude Opus 4.8 отличается от 4.7: бенчмарки, честность модели, dynamic workflows в Claude Code и контроль усилий. Разбираемся, стоит ли переключаться.
Claude Code
Anthropic добавил /goal в Claude Code: команда задаёт условие, а маленькая модель проверяет каждый ход и продолжает работу до результата. Разбираю, что это меняет на практике.
Claude Code
Anthropic добавила Agent View в Claude Code — одно окно для управления параллельными сессиями, фоновыми задачами и контролем агентов прямо в терминале.
Google переосмысляет ноутбуки после 15 лет с Chromebook: новая категория Googlebook на Android и ChromeOS с Gemini внутри. Релиз осенью 2026.
AI
Telegram превратил мессенджер в рантайм для AI-агентов: вызывай бота через @ в любом чате, боты общаются между собой, ответы стримятся.
LLM
Google выпустил Multi-Token Prediction drafters для Gemma 4. Та же модель, та же точность, в три раза быстрее на одном железе.
Claude
Anthropic подписал партнёрство со SpaceX и забирает весь compute дата-центра Colossus 1: это 300 МВт мощности и 220 000 NVIDIA GPU. Параллельно компания удвоила лимиты Claude Code и подняла rate limits API для Opus.
AI
AI-агенты вроде Claude Code хорошо работают с CLI. Разбираю пример CloudWatch Insights tool и почему иногда обычный терминальный интерфейс лучше MCP.
OpenAI
OpenAI выпустила GPT-5.5 и GPT-5.5 Pro. Обгоняет Claude Opus 4.7 на Terminal-Bench (82,7% vs 69,4%), 400K контекст в Codex. Что реально изменилось.
Личный блог про AI и автоматизацию. Тестирую новые LLM, пишу гайды по инструментам и делюсь тем, что помогает в работе.
OpenAI показала ChatGPT Images 2.0 — генератор картинок, который «думает» перед рисованием, аккуратно пишет текст на русском и собирает сложные журнальные композиции.
Nous Research выкатили Hermes Agent — open-source агент на сервер с памятью между сессиями, субагентами и каналами в Telegram/Slack/Discord. Разбираю фичи и сравниваю с OpenClaw.
Бенчмарк KillBench от White Circle протестировал 15 топовых LLM на 1,35 млн сценариев «кого спасти». Bias нашли у каждой модели, а структурированный вывод почти обнуляет safety.
Разбираемся в Claude Design — новом продукте Anthropic Labs. Как промпт превращается в прототип, что такое handoff в Claude Code и почему акции Figma просели на 7% после анонса.
Forrest Chang собрал в один CLAUDE.md файл 4 принципа Карпатого против переусложнения, додумывания и drive-by-правок. 48к звёзд за пару месяцев.
Новый флагман Anthropic: сильнее в сложных задачах, лучше видит картинки, появились xhigh и /ultrareview. Разбираю, что поменялось.
Anthropic запустила Managed Agents. Готовый агентный harness в облаке: контейнеры, инструменты, стриминг. Разбираемся, что это и зачем.
Open-source система памяти для AI-агентов от Миллы Йовович. 96.6% recall на LongMemEval, полностью локальная, бесплатная, с MCP-интеграцией.
GLM-5.1 набрала 45.3 балла в кодинг-бенчмарке — всего 2.6 балла от Claude Opus 4.6. Обучена на чипах Huawei, скоро выйдет в open source под MIT.
Alibaba выпустила Qwen 3.6-Plus с контекстом в 1 миллион токенов. Модель обходит Claude на Terminal-Bench и претендует на лидерство в агентном кодинге.
Google выпустил Gemma 4 — четыре открытые модели от 2B до 31B параметров на технологиях Gemini 3. 31B занимает третье место среди открытых моделей, а E2B работает на Raspberry Pi за 1.5 ГБ памяти.
Microsoft представила MAI-Transcribe-1, MAI-Voice-1 и MAI-Image-2. Собственные модели, агрессивные цены и явный курс на независимость от OpenAI.