Как измерить LLM для задач кибербезопасности: обзор открытых бенчмарков
В области оценки языковых моделей (LLM) для кибербезопасности отсутствует единая система. Существующие бенчмарки часто противоречивы, а некоторые из них — небрежно составлены. Однако можно...
Как языковая модель помогает контролировать качество инструктажей по охране труда в металлургии
В металлургии инструктаж по охране труда — это критически важный элемент техники безопасности. Для обеспечения максимально возможного качества инструктажей используется корпоративная LLM-система...
Обновлённый токенизатор видео K-VAE 2.0 от Сбера
Несколько месяцев назад мы выпустили токенизаторы для видео и изображений — KVAE-1.0. Сегодня представляем следующее поколение: KVAE-2.0. Это две новые модели, которые превосходят Wan 2.2 и...
Токсичный контент, промпт-хакинг и защита ИИ: всё о Guardrails для LLM
Когда в архитектуру веб-приложения добавляется языковая модель, привычные подходы к безопасности перестают работать. SQL-инъекции, XSS, CSRF — всё это давно изучено, но LLM вводит новый класс...
Умный город начинается с точного взгляда: как Falcon Tech меняет городскую среду
Понятие «умный город» уже перестало быть футуристичным — это реальность прогрессивных мегаполисов. Речь идет не просто о камерах и ИИ, а об инфраструктуре, способной предвосхищать проблемы. Она не...
Умный город начинается с точного взгляда: как Фалькон Тех меняет пространство к лучшему
Понятие «Умный город» всё ещё звучит футуристично, но уже сегодня это реальность многих прогрессивных городов мира. Речь здесь не только о технике: камерах, беспилотниках и ИИ, хотя об этом...
Убийцы OpenAI, Google и Anthropic уже здесь
Эпоха языковых моделей подходит к концу У крупнейших игроков в области ИИ возникла проблема старения. Вместо поиска новых решений они продолжают наращивать вычислительную мощь — и это грубая...
Искусственный архитектор: как нейросети справляются с проектированием ПО
Большие языковые модели (LLM) могут генерировать варианты архитектур, оценивать компромиссы и предлагать решения быстрее, чем это возможно вручную. Они могут помочь в задачах архитекторов ПО,...
Full-stack верификация: как Playwright-агент тестирует UI и проверяет базу данных без единой строки SQL
Тест на оформление заказа нажимает «Оформить заказ» и видит зелёный тост. Хорошо. Но проверяет ли он, что строка действительно записалась в базу? Правильно ли добавлены позиции? Уменьшился ли...
Как я заставил ИИ писать код по книжке: Clean Architecture + TDD на автопилоте
Это продолжение первой статьи про взрослый вайб-код для разработчиков, перешедших на тёмную сторону. Ради этой части, по сути, и писалась первая: меня попросили опубликовать свой ИИ-фреймворк, в...
Безопасность и приватность в голосовом управлении — как защитить умный дом от утечек и взломов
Когда я начинал работу над дипломным проектом «Умный дом» в 2020–2021 годах, мои приоритеты были просты: функциональность, точность, производительность. Безопасность оставалась за кадром. Это была...
Как я навайбкодил приложение для анализа графов с помощью Claude Code
Изначально я скептически относился к генерации кода с помощью ИИ. Ранее опыт с GPT в Copilot вызывал больше раздражения, чем пользы. Ожидал, что Claude, возможно, что-то сгенерирует, но потом...