Загадочный чатбот из 60-х, к которому стояли очереди из девушек
В одном из кампусов Массачусетского технологического института в 1966 году начали происходить странные вещи. У дверей лаборатории собирались студентки и лаборантки, мечтавшие провести хотя бы...
Проблемы в работе над стилем в AI-видео – и как их решать
Стиль в AI-кино играет решающую роль, но модели часто усредняют визуальное решение. Эта статья предлагает практические способы удержать стиль и вернуть контроль над результатом. Проблема 1: Модель...
Допиливаем InferSim для моделирования загрузки промышленных GPU
Мы допилили открытый симулятор InferSim от Alibaba для моделирования загрузки промышленных GPU. Что такое InferSim и почему он крут InferSim — это Python-симулятор, который умеет вычислять...
OpenAI Privacy Filter: красивая архитектура в суровых условиях русского бенчмарка
22 апреля 2026 года OpenAI представила OpenAI Privacy Filter — открытую модель для поиска и маскирования персональных данных (PII) в тексте. На бумаге всё выглядит впечатляюще: компактная...
Как мы заставили vLLM «лениться» под нагрузкой и спасли Time-to-First-Token
Деплой больших языковых моделей (LLM) — это всегда боль при пиковых нагрузках. В классических веб-сервисах при высоких RPS можно включить балансировщик или вернуть HTTP 429 Too Many Requests. Но в...
Нейросеть для презентаций Gamma App — что умеет и как оплатить из России
Gamma — самый популярный ИИ-инструмент для генерации презентаций. Миллионы пользователей, регулярные обновления, но при этом многие до конца не понимают, как он работает.Разберём, как устроена...
Как выжать максимум из локальных LLM: Ollama против llama.cpp и новые кванты
Запуск локальных больших языковых моделей (LLM) стал проще благодаря таким инструментам, как Ollama и LM Studio. Однако, эти решения часто уступают в скорости и качестве по сравнению с более...
Telegram-бот за вечер: как AI-ассистированная разработка изменила мой инженерный процесс
Я Java-разработчик с 5-летним опытом и 3 годами коммерческой разработки. Последние 10 месяцев я руководил небольшой командой. Недавно я начал использовать Spec-Driven Development с помощью Spec...
Создание Kotlin-агента широкого профиля KMP с помощью фреймворка Koog
В статье рассказывается о создании агента для генерации простых KMP приложений и кросс-платформенных задач с помощью фреймворка Koog. Описывается процесс подключения зависимости в gradle,...
Gemma 4: семейство открытых моделей ИИ
Gemma 4 – это семейство открытых моделей ИИ, представляющее собой несколько вариантов для разных задач и устройств. Младшие версии (E2B и E4B) предназначены для работы на мобильных устройствах и...
Я строю AI-бот для самопознания: спек, архитектура и почему LLM — периферия
Статья о создании AI-бота для самопознания. Продукт строится на основе event sourcing, инвариантов и Stability Engine. LLM используется как периферийный компонент, а не как ядро. Проблема:...
Как OpenAI закрыла DALL-E
R.I.P. DALL-E. Я помню, как впервые попробовал DALL-E. Ввёл запрос: «кот в деловом костюме читает газету» — и картинка появилась. Я просто смотрел на экран десять секунд. В тот момент стало ясно:...