LLM
GLM-5.1: китайская модель на 94.6% от Claude Opus в кодинге
GLM-5.1 набрала 45.3 балла в кодинг-бенчмарке — всего 2.6 балла от Claude Opus 4.6. Обучена на чипах Huawei, скоро выйдет в open source под MIT.
LLM
GLM-5.1 набрала 45.3 балла в кодинг-бенчмарке — всего 2.6 балла от Claude Opus 4.6. Обучена на чипах Huawei, скоро выйдет в open source под MIT.
LLM
Alibaba выпустила Qwen 3.6-Plus с контекстом в 1 миллион токенов. Модель обходит Claude на Terminal-Bench и претендует на лидерство в агентном кодинге.
Google выпустил Gemma 4 — четыре открытые модели от 2B до 31B параметров на технологиях Gemini 3. 31B занимает третье место среди открытых моделей, а E2B работает на Raspberry Pi за 1.5 ГБ памяти.
Новости
Microsoft представила MAI-Transcribe-1, MAI-Voice-1 и MAI-Image-2. Собственные модели, агрессивные цены и явный курс на независимость от OpenAI.
Claude
Anthropic добавила Computer Use в Claude Cowork и Code. AI кликает, скроллит и управляет приложениями, а Dispatch позволяет давать задания с телефона.
Новости
Google выпустила лучшую аудиомодель в линейке Gemini. Быстрые ответы, понимание интонаций и расширение Search Live на 200+ стран.
Новости
Anthropic запустил auto mode в Claude Code: вместо ручного одобрения каждого действия AI-классификатор сам решает, безопасно ли выполнение.
Разработка
Bassim Eledath предложил фреймворк из 8 уровней агентного инжиниринга. От автокомплита в Copilot до автономных команд агентов, которые координируются между собой без человека.
AI
Cursor — зрелый мультимодельный IDE с enterprise-фичами. Qoder — молодой конкурент от Alibaba с Quest Mode и Repo Wiki. Разбираемся, кому что ближе.
AI
Китайская MiniMax выпустила M2.7 — первую модель, которая активно участвовала в собственной эволюции. Бенчмарки на уровне топовых закрытых моделей.
AI
Anthropic пригласила 80 508 пользователей Claude из 159 стран на интервью с AI-интервьюером. Результат — крупнейшее качественное исследование: что люди ждут от AI, что уже получают и чего боятся.
глоссарий
Agent harness — всё, что окружает AI-модель и превращает её в рабочего агента. Разбираем компоненты, примеры и отличие от framework.