Все Ars Technica AI Habr AI MIT Tech Review AI TechCrunch AI The Verge AI Two Minute Papers VentureBeat AI Yannic Kilcher
Загадочный чатбот из 60-х, к которому стояли очереди из девушек

Загадочный чатбот из 60-х, к которому стояли очереди из девушек

В одном из кампусов Массачусетского технологического института в 1966 году начали происходить странные вещи. У дверей лаборатории собирались студентки и лаборантки, мечтавшие провести хотя бы...

Habr AI
Проблемы в работе над стилем в AI-видео – и как их решать

Проблемы в работе над стилем в AI-видео – и как их решать

Стиль в AI-кино играет решающую роль, но модели часто усредняют визуальное решение. Эта статья предлагает практические способы удержать стиль и вернуть контроль над результатом. Проблема 1: Модель...

Habr AI
Допиливаем InferSim для моделирования загрузки промышленных GPU

Допиливаем InferSim для моделирования загрузки промышленных GPU

Мы допилили открытый симулятор InferSim от Alibaba для моделирования загрузки промышленных GPU. Что такое InferSim и почему он крут InferSim — это Python-симулятор, который умеет вычислять...

Habr AI

OpenAI Privacy Filter: красивая архитектура в суровых условиях русского бенчмарка

22 апреля 2026 года OpenAI представила OpenAI Privacy Filter — открытую модель для поиска и маскирования персональных данных (PII) в тексте. На бумаге всё выглядит впечатляюще: компактная...

Habr AI

Как мы заставили vLLM «лениться» под нагрузкой и спасли Time-to-First-Token

Деплой больших языковых моделей (LLM) — это всегда боль при пиковых нагрузках. В классических веб-сервисах при высоких RPS можно включить балансировщик или вернуть HTTP 429 Too Many Requests. Но в...

Habr AI
Нейросеть для презентаций Gamma App — что умеет и как оплатить из России

Нейросеть для презентаций Gamma App — что умеет и как оплатить из России

Gamma — самый популярный ИИ-инструмент для генерации презентаций. Миллионы пользователей, регулярные обновления, но при этом многие до конца не понимают, как он работает.Разберём, как устроена...

Habr AI
Как выжать максимум из локальных LLM: Ollama против llama.cpp и новые кванты

Как выжать максимум из локальных LLM: Ollama против llama.cpp и новые кванты

Запуск локальных больших языковых моделей (LLM) стал проще благодаря таким инструментам, как Ollama и LM Studio. Однако, эти решения часто уступают в скорости и качестве по сравнению с более...

Habr AI
Telegram-бот за вечер: как AI-ассистированная разработка изменила мой инженерный процесс

Telegram-бот за вечер: как AI-ассистированная разработка изменила мой инженерный процесс

Я Java-разработчик с 5-летним опытом и 3 годами коммерческой разработки. Последние 10 месяцев я руководил небольшой командой. Недавно я начал использовать Spec-Driven Development с помощью Spec...

Habr AI
Создание Kotlin-агента широкого профиля KMP с помощью фреймворка Koog

Создание Kotlin-агента широкого профиля KMP с помощью фреймворка Koog

В статье рассказывается о создании агента для генерации простых KMP приложений и кросс-платформенных задач с помощью фреймворка Koog. Описывается процесс подключения зависимости в gradle,...

Habr AI
Gemma 4: семейство открытых моделей ИИ

Gemma 4: семейство открытых моделей ИИ

Gemma 4 – это семейство открытых моделей ИИ, представляющее собой несколько вариантов для разных задач и устройств. Младшие версии (E2B и E4B) предназначены для работы на мобильных устройствах и...

Habr AI
Я строю AI-бот для самопознания: спек, архитектура и почему LLM — периферия

Я строю AI-бот для самопознания: спек, архитектура и почему LLM — периферия

Статья о создании AI-бота для самопознания. Продукт строится на основе event sourcing, инвариантов и Stability Engine. LLM используется как периферийный компонент, а не как ядро. Проблема:...

Habr AI
Как OpenAI закрыла DALL-E

Как OpenAI закрыла DALL-E

R.I.P. DALL-E. Я помню, как впервые попробовал DALL-E. Ввёл запрос: «кот в деловом костюме читает газету» — и картинка появилась. Я просто смотрел на экран десять секунд. В тот момент стало ясно:...

Habr AI