Claude Code
Claude Code /goal: автономная работа Claude до результата
Anthropic добавил /goal в Claude Code: команда задаёт условие, а маленькая модель проверяет каждый ход и продолжает работу до результата. Разбираю, что это меняет на практике.
Claude Code
Anthropic добавил /goal в Claude Code: команда задаёт условие, а маленькая модель проверяет каждый ход и продолжает работу до результата. Разбираю, что это меняет на практике.
AI
Telegram превратил мессенджер в рантайм для AI-агентов: вызывай бота через @ в любом чате, боты общаются между собой, ответы стримятся.
LLM
Google выпустил Multi-Token Prediction drafters для Gemma 4. Та же модель, та же точность, в три раза быстрее на одном железе.
OpenAI
OpenAI выпустила GPT-5.5 и GPT-5.5 Pro. Обгоняет Claude Opus 4.7 на Terminal-Bench (82,7% vs 69,4%), 400K контекст в Codex. Что реально изменилось.
ChatGPT
OpenAI показала ChatGPT Images 2.0 — генератор картинок, который «думает» перед рисованием, аккуратно пишет текст на русском и собирает сложные журнальные композиции.
AI
Nous Research выкатили Hermes Agent — open-source агент на сервер с памятью между сессиями, субагентами и каналами в Telegram/Slack/Discord. Разбираю фичи и сравниваю с OpenClaw.
LLM
Бенчмарк KillBench от White Circle протестировал 15 топовых LLM на 1,35 млн сценариев «кого спасти». Bias нашли у каждой модели, а структурированный вывод почти обнуляет safety.
Claude
Разбираемся в Claude Design — новом продукте Anthropic Labs. Как промпт превращается в прототип, что такое handoff в Claude Code и почему акции Figma просели на 7% после анонса.
Claude
Forrest Chang собрал в один CLAUDE.md файл 4 принципа Карпатого против переусложнения, додумывания и drive-by-правок. 48к звёзд за пару месяцев.
Claude
Новый флагман Anthropic: сильнее в сложных задачах, лучше видит картинки, появились xhigh и /ultrareview. Разбираю, что поменялось.
AI
Open-source система памяти для AI-агентов от Миллы Йовович. 96.6% recall на LongMemEval, полностью локальная, бесплатная, с MCP-интеграцией.
LLM
GLM-5.1 набрала 45.3 балла в кодинг-бенчмарке — всего 2.6 балла от Claude Opus 4.6. Обучена на чипах Huawei, скоро выйдет в open source под MIT.