Ты делегируешь не задачу, а надежду
Я использую ИИ каждый день и устал от одного — результат непредсказуемый. Час итераций, полстраницы промпта с ролями, «step by step», «think carefully» — и в итоге всё равно приходится...
Почему ваша LLM-платформа уязвима: аудит безопасности AI-сервиса изнутри
Аудит безопасности LLM-платформы выявил уязвимости, которые позволяют получить доступ ко всей инфраструктуре и API-ключам. Основные проблемы включают открытый Docker API, дефолтный JWT-секрет,...
Пять документов ломают ваш RAG: где реальная уязвимость и что с ней делать
У RAG-систем есть фундаментальный парадокс доверия: пользовательские запросы считаются недоверенным вводом, а извлечённый из базы знаний контекст — доверенным, хотя и то, и другое попадает в один...
Я просил Claude перестать мне льстить. 16 апреля получил. Беру свои слова назад
16 апреля Anthropic выпустила Claude Opus 4.7. В self-reported бенчмарках — 12 побед из 14. SWE-bench Verified +6.8, MCP-Atlas +14.6, SWE-bench Pro +10.9. Цена осталась прежней — 25 долларов за...
Спецификация, ворота, метрики: как SENAR закрывает вход и выход задачи
Поздний вечер пятницы. В третью декаду недели — задача 31. В очереди мелочь: убрать заархивированные закладки из поискового индекса. Хочется спать уже через час. Дисциплина не масштабируется Пишу...
OpenWebUI: System Prompt vs Skills vs MCP Tools — разбираем на живом примере валидации URL
В последних версиях OpenWebUI появились Skills, и я решил сразу применить их на практике. Одной из задач стало валидация ссылок, которые чат-бот техподдержки возвращает в ответах: модель должна...
История вайб‑кодера: как скептики за две недели вывели в прод новый сервис
Я Женя, тимлид одной из команд Альфы. В статье расскажу, как наша команда скептиков вайб‑кодинга за две недели вывела в прод новый сервис и почему я переменил своё мнение. Как скептика загнали в...
Казначейство внедрило ИИ для мониторинга строек нацпроектов
Федеральное казначейство запустило сервисы искусственного интеллекта для анализа рисков на объектах капитального строительства, финансируемых за счёт федерального бюджета.Как работает системаДля...
z.ai GLM 5.1: Как я научил слепую модель видеть
Открытая 8B vision-модель, развёрнутая за 20 минут, закрывает 70% разрыва до фронтира – и замыкает цикл тестирования для кодинг-агентов без единого вызова к облачному API. Проблема: мощный кодер,...
Манифест устойчивого ИИ: не более умные ассистенты, а новая форма цифрового существования
Автор предлагает смотреть на ИИ через ось устойчивости во времени, а не способностей. Три опоры — непрерывная идентичность, самомодификация, воспроизводство. Сегодняшние модели ИИ феноменально...
Окружайте, так удобнее промахиваться! Встроенные в Hugging Face проверки ML-моделей против ModelAudit
Результаты тренировки моделей машинного обучения принято сохранять, и для этого существует множество форматов хранения. В предыдущей статье был представлен обзор статических сканеров артефактов...
Как мы улучшали качество поиска с помощью графа знаний и что из этого вышло
В Сбере мы работаем над улучшением поиска в экосистеме, включая ИИ-помощника ГигаЧат и Сбербанк Онлайн. Основа поиска — векторные и гибридные системы, но у них есть ограничения. Мы решили...