Делаем лимиты ИИ почти бесконечными: умный роутер, который режет затраты на токены в разы
У меня несколько пет-проектов, которые используют LLM через API. Чат-бот для внутренних задач, генератор тестов, скрипты для код-ревью. Ничего масштабного, но за неделю расходы достигли $47 — и...
PromptPilot: шедулер задач для Claude Code, Codex и других AI CLI
«Всё у нас, Луцилий, чужое, одно лишь время наше» Сенека, Письма к Луцилию, I, 3.В эпоху подписок на ИИ это особенно верно: квоты токенов, лимиты запросов и периоды сброса — всё это задаёт...
Человек после цифровой эпохи: заменят ли нас машины или мы станем их частью
Статья о том, как цифровая эпоха меняет не только технологии, но и самого человека: труд, свободу выбора, роль творчества и границы ответственности.Это попытка честно посмотреть в будущее без...
ИИ-агенты для бизнеса: почему о них говорят, но неохотно внедряют
Крупный и средний бизнес всё чаще обсуждает внедрение ИИ-агентов, но на практике движется медленно. Руководители уже не удовлетворяются простыми чат-ботами и спрашивают: «Когда ИИ начнёт принимать...
Аудит сайта CEO Y Combinator: 6,4 МБ мусора вместо простого блога
Я провёл аудит сайта CEO Y Combinator Гарри Тана после его заявления о том, что он выдаёт по 37 тысяч строк кода в день на протяжении 72 дней подряд. Результаты показывают, как выглядит в...
Почему никто не ожидал, что предсказание следующего слова окажется таким успешным
Большие языковые модели по-прежнему работают по принципу предсказания следующего слова. Два года назад этого казалось достаточно, чтобы считать их ограниченными — их логика выглядела неуклюжей. Но...
КП за 30 секунд и ещё 9 задач, которые я больше не делаю вручную
Я работаю с Claude каждый день, по многу часов. За это время я автоматизировал множество рутинных задач — от утренних брифингов до генерации коммерческих предложений. Не в теории, а в реальности....
Свой ИИ без облаков: практический гайд по llama.cpp + Qwen
В этой статье рассказывается, как установить большую языковую модель (LLM) на собственное оборудование с помощью llama.cpp и модели Qwen. Это позволяет использовать ИИ локально, не передавая...
Почему AI-generated UI стоит изучать как источник визуальных мутаций
Когда речь заходит об AI-generated UI, дискуссия обычно сворачивает в одну из двух крайностей. Первая: можно ли это сразу использовать в продакшене? Вторая: насколько результат соответствует...
GEO/AEO для B2B: почему AI почти не рекомендует ваш SaaS, даже если сайт сделан нормально
У B2B SaaS появилась новая проблема, которую многие команды ещё недооценивают.Компания может сделать качественный сайт: аккуратный лендинг, понятный продукт, базовое SEO, кейсы, блог,...
Синтетика как топливо: почему self-training работает и где начинается model collapse
В индустрии ИИ возникла острая проблема: качественные человеческие данные становятся дефицитом, в то время как вычислительные мощности доступны. Логичный ответ — создавать данные искусственно....
Agentis Memory — Redis-совместимое хранилище со встроенным векторным поиском и локальными эмбеддингами
Разработка настоящих AI-агентов требует не только продуманной архитектуры, но и общей памяти, которой у большинства решений попросту нет. Агенты работают изолированно, что приводит к дублированию...