GLM-5.1: китайская модель на 94.6% от Claude Opus в кодинге
GLM-5.1 набрала 45.3 балла в кодинг-бенчмарке — всего 2.6 балла от Claude Opus 4.6. Обучена на чипах Huawei, скоро выйдет в open source под MIT.
GLM-5.1 набрала 45.3 балла в кодинг-бенчмарке — всего 2.6 балла от Claude Opus 4.6. Обучена на чипах Huawei, скоро выйдет в open source под MIT.
Alibaba выпустила Qwen 3.6-Plus с контекстом в 1 миллион токенов. Модель обходит Claude на Terminal-Bench и претендует на лидерство в агентном кодинге.
Google выпустил Gemma 4 — четыре открытые модели от 2B до 31B параметров на технологиях Gemini 3. 31B занимает третье место среди открытых моделей, а E2B работает на Raspberry Pi за 1.5 ГБ памяти.
Microsoft представила MAI-Transcribe-1, MAI-Voice-1 и MAI-Image-2. Собственные модели, агрессивные цены и явный курс на независимость от OpenAI.
Anthropic добавила Computer Use в Claude Cowork и Code. AI кликает, скроллит и управляет приложениями, а Dispatch позволяет давать задания с телефона.
Google выпустила лучшую аудиомодель в линейке Gemini. Быстрые ответы, понимание интонаций и расширение Search Live на 200+ стран.
Anthropic запустил auto mode в Claude Code: вместо ручного одобрения каждого действия AI-классификатор сам решает, безопасно ли выполнение.
Bassim Eledath предложил фреймворк из 8 уровней агентного инжиниринга. От автокомплита в Copilot до автономных команд агентов, которые координируются между собой без человека.
Cursor — зрелый мультимодельный IDE с enterprise-фичами. Qoder — молодой конкурент от Alibaba с Quest Mode и Repo Wiki. Разбираемся, кому что ближе.
Китайская MiniMax выпустила M2.7 — первую модель, которая активно участвовала в собственной эволюции. Бенчмарки на уровне топовых закрытых моделей.
Anthropic пригласила 80 508 пользователей Claude из 159 стран на интервью с AI-интервьюером. Результат — крупнейшее качественное исследование: что люди ждут от AI, что уже получают и чего боятся.
Agent harness — всё, что окружает AI-модель и превращает её в рабочего агента. Разбираем компоненты, примеры и отличие от framework.
AI
Qoder строит визуальную IDE с Quest Mode и Spec-документами. Claude Code делает ставку на терминал и Unix-философию. Разбираемся, кому что подходит.
Claude
Channels превращают Claude Code в хаб для внешних событий. Показываю, как подключить Telegram, Discord и написать свой webhook-канал за 5 минут.
Dev Tools
JetBrains Air — новая среда разработки, где несколько AI-агентов работают параллельно в изолированных окружениях. Разбираю, что внутри и кому это нужно.
Claude
Отобрал 10 воркфлоу Claude Code, которые использую каждый день — Plan Mode, worktrees, субагенты, сессии и другие приёмы с примерами.
Claude
Anthropic запустила Dispatch — новую функцию Claude Cowork, позволяющую управлять AI-агентом на десктопе прямо с телефона.
Агенты
Anthropic выделяют три паттерна воркфлоу AI-агентов, которые покрывают большинство задач на проде. Разбираемся, когда какой использовать и как их комбинировать.
OpenAI
OpenAI выпустила GPT-5.4 Mini и Nano. Mini почти догоняет флагман на кодинге и computer use, но работает вдвое быстрее. Разбираю бенчмарки, цены и когда какую использовать.
OpenAI
Разбираю фичу субагентов в Codex — как создать кастомных агентов через TOML, запускать параллельно и не утонуть в токенах.
AI
Zhipu AI выпустила GLM-5-Turbo: $1.20/1M input, tool call error rate 0.67%, закрытая лицензия. Сравнение с GLM-5, ценами конкурентов и инструкция подключения.
Dev Tools
Pencil — канвас для дизайна, который живёт в IDE. Файлы .pen хранятся в Git, AI рисует макеты через MCP, на выходе — HTML, CSS и React.
Dev Tools
CLI для Firecrawl — скрейпинг, краулинг и AI-агент для извлечения данных с любого сайта прямо из терминала. 500 бесплатных кредитов для старта.
Dev Tools
AI-навык с 40k звёзд на GitHub, который учит кодинг-ассистенты понимать дизайн. 67 стилей, 161 палитра, поддержка 15 IDE.