Представьте: понедельник, 10:00. В календаре — ежеквартальный all-hands на час. CEO заходит в Teams с видом человека, которому есть что сказать. Первые пять минут — действительно интересно. Потом начинается.
«Наша миссия — создавать ценность для клиентов, двигаясь вперёд как единая команда к амбициозным целям следующего квартала, опираясь на наши ключевые компетенции и синергию между подразделениями...»
Вы смотрите в экран. Потом в окно. Потом снова в экран. Мозг предательски начинает думать о том, что бы поесть на обед и не пора бы поставить кофе.
Хочется включить встречу фоном и заняться своим делом. Но неловко — вдруг скажут что-то важное? А если бы можно было потом быстро пробежаться по тексту и вытащить три реальных факта из часового эфира? Или запихнуть всё это в LLM, чтобы она всё сделала за вас?
Всё запрещено, но есть нюанс
Первая мысль — записать. Teams умеет, но в нашем случае запись на уровне корпоративного аккаунта отключена. Транскрипция — тоже. ИТ говорит «нельзя», и точка.
Ладно, сторонние сервисы. Их море. Но у всех одна история: платная подписка, а ваш аудио улетает на чужие серверы. Для личных звонков — окей. Для рабочих встреч, где обсуждается всё подряд, — уже не очень. Корпоративная паранойя? Может быть. Но я предпочитаю не проверять.
И тут я подумал: а что мешает записывать системный звук локально? Политика по установке софта? Если я напишу приложение сам и скомпилирую его из исходников — это не нарушение. Политика безопасности? Данные вообще никуда не уходят.
Законный лаз найден. Осталось написать приложение.
Написал. Пользуюсь. Доволен.
Почти месяц живу с BoringMeeting. Приложение делает ровно одно: записывает системный звук и транскрибирует его локально, через офлайн AI-модель. Никакого облака, никаких аккаунтов, никакой подписки. Поставил и забыл.
Workflow простой до неприличия:
- Нажал «Начать запись» — пошёл на митинг
- Нажал «Стоп» — запустил транскрипцию
- Через несколько минут получил текст
- Скормил его в ChatGPT или корпоративный AI (у нас официально есть корпоративная LLM) — получил саммари на три абзаца
Час «корпоративного синергетического контента» превращается в два абзаца того, что реально важно. Жизнь налаживается!
Дал попользоваться паре знакомых — отзывы оказались неожиданно тёплыми. Подумал: а почему бы не выложить? Единственная проблема — аккаунта разработчика Apple у меня нет, и заводить его ради одного приложения как-то не хотелось. Выручил знакомый. Apple модерировал приложение несколько недель — но в итоге одобрил. Так BoringMeeting оказался в App Store, что само по себе немного тешит мое самолюбие.
Сценарии, которые я не планировал
Когда делаешь инструмент для одной задачи, он неожиданно начинает решать другие.
Собеседования. Записал звонок с кандидатом — потом спокойно разобрал с AI: что спросил, что услышал в ответ, что забыл уточнить. Без суеты в моменте. Мне было интересно обсудить с корпоративной LLM, как я могу улучшить себя как интервьюер.
Сбор требований. Созвон с бизнес-пользователем, где они час рассказывают, чего хотят, а вы киваете и судорожно пишете. Теперь просто делаю заметки по ключевым моментам (всё же не доверяю 100% тупой машине) и записываю встречу. Потом прогоняю через корпоративную LLM и получаю черновик требований. Не финальный документ, но 70% работы уже сделано.
Философия: меньше — лучше
Я сделал приложение, которым сам хотел пользоваться. А значит — никакого bloatware.
Современные приложения страдают одной болезнью: они пытаются делать всё сразу и затянуть вас в свою экосистему. Транскрипция? Окей, но давайте ещё summary, action items, интеграция со Slack и календарём, теги, дашборд с аналитикой звонков, командная коллаборация и premium-план за $29/месяц.
Мой BoringMeeting этого не делает. Он пишет звук. Он транскрибирует. Он отдаёт текст. Дальше — ваше дело. Никакой экосистемы. Никакой подписки. Данные не покидают ваш Mac — от слова совсем.
Основные фишки
- Запись системного аудио — Teams, Zoom, Meet, браузер, что угодно
- Офлайн-транскрипция на Apple Silicon (M1+) — без интернета, без облака
- Поддержка множества языков, потому что под капотом используется Whisper kit
- Фоновая запись — переключайтесь между приложениями как обычно
- Обычный текстовый файл на выходе
- Бесплатно. Совсем
Офлайн-модель для транскрипции скачивается отдельно при первом запуске и весит от ~100 МБ до ~3 ГБ в зависимости от выбранного уровня качества.
Статус и планы
Приложение живёт в App Store и распространяется «как есть». Я не стартап, не команда и не VC-funded продукт с роадмапом на три года.
Если будет интерес — буду чинить баги и потихоньку развивать. Если не будет — оно и так работает, мне хватает.
Любой фидбек приветствуется: что сломалось, чего не хватает, где ведёт себя странно. Пишите в комментариях или на почту.