LLM
GLM-5.1: китайская модель на 94.6% от Claude Opus в кодинге
GLM-5.1 набрала 45.3 балла в кодинг-бенчмарке — всего 2.6 балла от Claude Opus 4.6. Обучена на чипах Huawei, скоро выйдет в open source под MIT.
LLM
Alibaba выпустила Qwen 3.6-Plus с контекстом в 1 миллион токенов. Модель обходит Claude на Terminal-Bench и претендует на лидерство в агентном кодинге.
Google выпустил Gemma 4 — четыре открытые модели от 2B до 31B параметров на технологиях Gemini 3. 31B занимает третье место среди открытых моделей, а E2B работает на Raspberry Pi за 1.5 ГБ памяти.
Новости
Microsoft представила MAI-Transcribe-1, MAI-Voice-1 и MAI-Image-2. Собственные модели, агрессивные цены и явный курс на независимость от OpenAI.
Claude
Anthropic добавила Computer Use в Claude Cowork и Code. AI кликает, скроллит и управляет приложениями, а Dispatch позволяет давать задания с телефона.
Новости
Google выпустила лучшую аудиомодель в линейке Gemini. Быстрые ответы, понимание интонаций и расширение Search Live на 200+ стран.
Новости
Anthropic запустил auto mode в Claude Code: вместо ручного одобрения каждого действия AI-классификатор сам решает, безопасно ли выполнение.
Разработка
Bassim Eledath предложил фреймворк из 8 уровней агентного инжиниринга. От автокомплита в Copilot до автономных команд агентов, которые координируются между собой без человека.
AI
Cursor — зрелый мультимодельный IDE с enterprise-фичами. Qoder — молодой конкурент от Alibaba с Quest Mode и Repo Wiki. Разбираемся, кому что ближе.
AI
Китайская MiniMax выпустила M2.7 — первую модель, которая активно участвовала в собственной эволюции. Бенчмарки на уровне топовых закрытых моделей.
Личный блог про AI и автоматизацию. Тестирую новые LLM, пишу гайды по инструментам и делюсь тем, что помогает в работе.
Anthropic пригласила 80 508 пользователей Claude из 159 стран на интервью с AI-интервьюером. Результат — крупнейшее качественное исследование: что люди ждут от AI, что уже получают и чего боятся.
Agent harness — всё, что окружает AI-модель и превращает её в рабочего агента. Разбираем компоненты, примеры и отличие от framework.
Qoder строит визуальную IDE с Quest Mode и Spec-документами. Claude Code делает ставку на терминал и Unix-философию. Разбираемся, кому что подходит.
Channels превращают Claude Code в хаб для внешних событий. Показываю, как подключить Telegram, Discord и написать свой webhook-канал за 5 минут.
JetBrains Air — новая среда разработки, где несколько AI-агентов работают параллельно в изолированных окружениях. Разбираю, что внутри и кому это нужно.
Отобрал 10 воркфлоу Claude Code, которые использую каждый день — Plan Mode, worktrees, субагенты, сессии и другие приёмы с примерами.
Anthropic запустила Dispatch — новую функцию Claude Cowork, позволяющую управлять AI-агентом на десктопе прямо с телефона.
Anthropic выделяют три паттерна воркфлоу AI-агентов, которые покрывают большинство задач на проде. Разбираемся, когда какой использовать и как их комбинировать.
OpenAI выпустила GPT-5.4 Mini и Nano. Mini почти догоняет флагман на кодинге и computer use, но работает вдвое быстрее. Разбираю бенчмарки, цены и когда какую использовать.
Разбираю фичу субагентов в Codex — как создать кастомных агентов через TOML, запускать параллельно и не утонуть в токенах.
Zhipu AI выпустила GLM-5-Turbo: $1.20/1M input, tool call error rate 0.67%, закрытая лицензия. Сравнение с GLM-5, ценами конкурентов и инструкция подключения.
Pencil — канвас для дизайна, который живёт в IDE. Файлы .pen хранятся в Git, AI рисует макеты через MCP, на выходе — HTML, CSS и React.