Когда нейросети перестанут галлюцинировать? И почему на «что за дичь» они несут ещё большую дичь?
Каждый, кто работал с большими языковыми моделями (LLM), знает эту боль. Ты задаёшь вопрос. Бот выдаёт уверенный, красивый, но абсолютно ложный ответ. Ты пишешь: «Что за дичь ты несёшь?» Бот...
AGENTS.md создавали, чтобы помогать агентам. Я использую его, чтобы их вычислять
Вместе с растущей AI-индустрией приходят и её побочки. Я мейнтейнер библиотекиreact-native-tdlibи довольно быстро заметил: все больше PR выглядят как чистый вывод агента. Сначала я честно...
___, или «Заголовок намеренно оставлен пустым»
Статья 3 из цикла «Слова, которых нет» Началоздесь >>>издесь >>> Возвращаюсь к случаю, с которого этот цикл начался. Моя коллега переводила интерфейс программы на иностранный язык с помощью LLM. В...
ИИ-боты сканируют даже логи TLS-сертификатов. Любая информация используется для обучения LLM
Согласно статистическому отчётуState of AI Trafficот компании по компьютерной безопасности Human Security, за последний год резко увеличилась активность ИИ-агентов, ботов и ИИ-инструментов в...
«Метафизика в формулах: математическое ядро «Веры Паломника — Исход»
От энтропии выбора к функции полезности Любви — новая модель для философов, физиков и ML-инженеров В предыдущей статье («Вариационное исчисление как метафора свободы выбора») мы предложили...
Вариационное исчисление как метафора свободы выбора: от градиентного спуска к онтологии пути
В современной науке о данных и машинном обучении мы постоянно решаем задачу оптимизации: найти в многомерном пространстве параметров точку, минимизирующую функцию потерь. Градиентный спуск, метод...
MCP-агрегатор: объединяем инструменты для LLM в один сервер
При работе с локальными LLM через Claude Desktop, Kilo Code, Cursor или другие MCP-клиенты часто возникает одна и та же ситуация: Нуженfilesystemдля работы с файлами,web-searchдля поиска в...
Дата-центры в космосе: как Google и SpaceX готовят новую инфраструктуру для ИИ
Развитие искусственного интеллекта требует всё больше вычислительных ресурсов. Каждая новая модель обучается на больших объёмах данных и использует всё более мощную инфраструктуру. Чтобы...
Пользователь пишет issue, агент меняет сайт. Да, я это сделал
Три месяца назад, в феврале, я написалкомментарий, что LLM-агенты могут обновлять кодовую базу по тикетам конечных пользователей и сразу выкатываться на прод. Некоторые коллеги эту идею...
Как Gemini 3.5 Flash сломали ради красивых графиков (и почему она обходит 3.1 Pro только на бумаге)
Буквально на днях Google выкатила gemini 3.5 flash. Маркетологи бьют в фанфары: легковесная модель обходит тяжелую gemini 3.1 pro на бенчмарках terminal bench 2.1 и MCP atlas! Но стоит открыть...
meta-attention is all you need
В этой статье я расскажу о интересной находке во время моих экспериментов с языковыми моделями, которую я решил назвать "мета-трансформерами". Или я нашел реально что-то интересное, или выдал...
Не цитируй мне нейросеть
Если твой ответ начинается с "Вот что мне сказал Claude:" или 800 слов неотредактированной простыни от ChatGPT - поздравляю: ты только что доказал, что твой мозг - просто прокладка. Дарвин бы...