Команда фундаментальных исследований искусственного интеллекта представила TRIBE — базовую модель, способную прогнозировать, как человеческий мозг обрабатывает визуальные, слуховые и языковые стимулы. Обученная на массивах данных фМРТ, полученных от добровольцев, модель имитирует нейронную активность, как виртуальный аналог реальных нейробиологических процессов.
Нейробиология in silico
TRIBE разработана для проведения «нейробиологических исследований in silico» — то есть моделирования нейронных реакций на языки, звуки и изображения без необходимости повторного сканирования мозга. Это прорыв в создании цифровых двойников мозга, позволяющих проводить тысячи виртуальных экспериментов быстрее и дешевле, чем в лаборатории.
Такой подход открывает путь к более совершенным интерфейсам «мозг-компьютер» и углублённому пониманию неврологических расстройств, таких как афазия или нарушения сенсорной обработки.
Ключевые достижения
- Разрешение в 70 раз выше — TRIBE моделирует нейронную активность с беспрецедентной детализацией по сравнению с предыдущими моделями.
- Обучение без предварительной настройки — модель способна предсказывать реакции мозга у людей, говорящих на языках, которые не использовались при её обучении.
- Виртуальные эксперименты — учёные могут тестировать гипотезы о работе мозга в цифровой среде, избегая дорогостоящих сеансов фМРТ.
Мультимодальная архитектура
В отличие от узкоспециализированных моделей, TRIBE — универсальная базовая система. Она обучалась на данных, собранных, когда участники смотрели фильмы и слушали подкасты. Это позволило модели отразить сложную, мультимодальную природу восприятия в реальной жизни.
Модель фокусируется на ключевых нейронных путях: вентральном потоке — отвечающем за визуальное распознавание, и слуховом потоке. В основе TRIBE — архитектура Transformer, та же, что используется в крупных языковых моделях, таких как GPT-4. Это обеспечивает синхронизацию обработки зрительной, слуховой и языковой информации.
Высокая эффективность и масштабируемость
Благодаря высокому разрешению, TRIBE позволяет предсказывать, как мозг реагирует на разные стимулы — от шепота до громких звуков, от статичных изображений до быстро движущихся объектов.
Модель работает быстрее аналогов и поддерживает обучение с нуля (zero-shot). Это означает, что она может интерпретировать реакции мозга на понятную человеку информацию, независимо от языка, без дополнительной настройки.
Будущее компьютерной нейронауки
TRIBE — как цифровая аэродинамическая труба для нейробиологии. Учёные могут использовать её как «виртуального испытуемого», чтобы тестировать гипотезы, выявлять потенциальные сбои в обработке сигналов и оптимизировать исследования.
Это ускоряет разработку технологий «мозг-компьютер» и углубляет понимание механизмов сознания и восприятия.
Этика и открытость
Исследователи из FAIR (Fundamental AI Research) в Meta подчёркивают приверженность открытой науке. Модель TRIBE v2, её код и демо-версия доступны научному сообществу.
Такая прозрачность направлена на безопасное и этичное применение технологии в целях изучения человеческого сознания и разработки терапий.
Ответы на ключевые вопросы
Что такое «нейробиология in silico» и как TRIBE её поддерживает?
Это направление, при котором биологические процессы моделируются на компьютере. TRIBE выступает в роли «цифрового двойника» мозга, позволяя проводить тысячи виртуальных экспериментов за секунды — до реальных сканирований на фМРТ.
Чем TRIBE отличается от прежних моделей?
Ранние модели были узконаправленными и индивидуализированными. TRIBE — мультимодальная базовая модель, обученная на разнообразных данных. Она универсальна, масштабируема и работает без переобучения на новых языках и людях.
Означает ли 70-кратный рост разрешения, что ИИ читает мысли?
Нет. TRIBE не расшифровывает внутренние монологи. Она прогнозирует, как мозг обрабатывает внешние стимулы — звуки, изображения, текст. Это шаг к пониманию «архитектуры» мышления, а не инструмент для чтения мыслей.