LLM и большие языковые модели

LLM

GLM-5.1: китайская модель на 94.6% от Claude Opus в кодинге

GLM-5.1 набрала 45.3 балла в кодинг-бенчмарке — всего 2.6 балла от Claude Opus 4.6. Обучена на чипах Huawei, скоро выйдет в open source под MIT.

LLM

Qwen 3.6-Plus: Alibaba бросает вызов Claude в агентном кодинге

Alibaba выпустила Qwen 3.6-Plus с контекстом в 1 миллион токенов. Модель обходит Claude на Terminal-Bench и претендует на лидерство в агентном кодинге.

Google

Gemma 4: открытые модели Google на технологиях Gemini 3

Google выпустил Gemma 4 — четыре открытые модели от 2B до 31B параметров на технологиях Gemini 3. 31B занимает третье место среди открытых моделей, а E2B работает на Raspberry Pi за 1.5 ГБ памяти.

Новости

Microsoft MAI: три модели для голоса, транскрипции и картинок

Microsoft представила MAI-Transcribe-1, MAI-Voice-1 и MAI-Image-2. Собственные модели, агрессивные цены и явный курс на независимость от OpenAI.

Новости

Gemini 3.1 Flash Live: голосовые агенты Google стали точнее

Google выпустила лучшую аудиомодель в линейке Gemini. Быстрые ответы, понимание интонаций и расширение Search Live на 200+ стран.

AI

MiniMax M2.7: модель, которая сама себя обучала

Китайская MiniMax выпустила M2.7 — первую модель, которая активно участвовала в собственной эволюции. Бенчмарки на уровне топовых закрытых моделей.

OpenAI

GPT-5.4 Mini и Nano: быстрые модели для кода и субагентов

OpenAI выпустила GPT-5.4 Mini и Nano. Mini почти догоняет флагман на кодинге и computer use, но работает вдвое быстрее. Разбираю бенчмарки, цены и когда какую использовать.

AI

GLM-5-Turbo: цены, сравнение с GLM-5 и настройка OpenClaw

Zhipu AI выпустила GLM-5-Turbo: $1.20/1M input, tool call error rate 0.67%, закрытая лицензия. Сравнение с GLM-5, ценами конкурентов и инструкция подключения.

AI

Как AI меняет рынок труда — данные Anthropic

Anthropic выпустили исследование с метрикой observed exposure: 75% задач программистов покрыты AI, но в целом используется треть от возможного. Найм молодых падает на 14%.

Google

Gemini Embedding 2: мультимодальные эмбеддинги Google

Google представила Gemini Embedding 2 — первую нативно мультимодальную модель эмбеддингов, которая объединяет текст, картинки, видео и аудио в одно векторное пространство.

AI

Jina VLM — мультиязычная VLM на 2.4B параметров

Jina VLM — маленькая VLM от Jina AI, которая обгоняет Qwen3-VL и InternVL3 в мультиязычном понимании картинок. 2.4B параметров, работает на обычном GPU.

OpenAI

GPT-5.4: computer use, tool search и 1M контекст

OpenAI выпустила GPT-5.4 — фронтирную модель с нативным computer use, tool search и контекстом до 1M токенов. Разбираю бенчмарки, цены и что изменилось.