Conntour привлекла $7 млн от General Catalyst и YC на ИИ-поиск для систем видеонаблюдения

Индустрия видеонаблюдения сегодня в центре внимания — и не всегда в лучшем свете. Скандалы вокруг того, как U.S. Immigration and Customs Enforcement использует сеть камер Flock, или как производитель домашних камер Ring добавляет функции, позволяющие полиции запрашивать отснятый материал у жильцов, подогревают споры о безопасности, приватности и том, кто кого контролирует.

Но споры не отменяют рынок. А развитие моделей машинного зрения и языковых ИИ (vision-language models) только ускоряет рост компаний, которые предлагают новые способы отслеживать происходящее на территории предприятий и организаций.

Матан Гольднер (Matan Goldner), сооснователь и CEO стартапа Conntour, говорит, что этические вопросы для них настолько важны, что компания тщательно выбирает клиентов. Для стартапа возрастом меньше двух лет это звучит как сомнительная бизнес-стратегия, но у Conntour уже есть крупные заказчики — в том числе государственные и публичные компании. Среди них, например, Центральное бюро по борьбе с наркотиками Сингапура.

«Наличие таких крупных клиентов позволяет нам выбирать. Мы полностью контролируем, кто использует нашу систему, в каких целях, и можем отбирать только те кейсы, которые считаем моральными и, конечно, законными. Мы используем собственное суждение и принимаем решения, зная, как клиент будет применять наш продукт»

Такой подход не только помогает сохранять этические стандарты, но и привлекает инвесторов. Недавно Conntour закрыла семяную ($7 млн) инвестиционную раунду с участием General Catalyst, Y Combinator, SV Angel и Liquid 2 Ventures.

По словам Гольднера, раунд был закрыт всего за 72 часа. «Я назначил около 90 встреч за восемь дней. Но уже через три дня — начали в понедельник, а к среде закончили», — рассказал он в эксклюзивном интервью TechCrunch.

Как работает ИИ-поиск по видео

Conntour создаёт платформу, которая позволяет сотрудникам службы безопасности искать по видеозаписям с камер с помощью естественного языка — как в поисковике. Например: «Найди, когда человек в кроссовках передавал пакет в холле». Система мгновенно просканирует все архивные и прямые трансляции и выдаст релевантные фрагменты.

В отличие от старых систем, которые ищут по жёстким правилам (например, «движение в зоне А»), Conntour использует модели машинного зрения и языковые ИИ, что делает поиск гибким и интуитивным.

Платформа не только отвечает на запросы, но и:

  • выдаёт текстовые ответы с прикреплёнными видео;
  • автоматически формирует отчёты об инцидентах;
  • самостоятельно отслеживает угрозы по заданным правилам и присылает оповещения.

Масштабируемость — ключевое преимущество

Главное отличие Conntour от конкурентов — масштабируемость. Платформа рассчитана на системы с тысячами камер. При этом она может обрабатывать до 50 видеопотоков на одной потребительской видеокарте — например, на Nvidia RTX 4090.

Достигается это за счёт умного выбора моделей: система определяет, какие алгоритмы использовать для каждого запроса, чтобы минимизировать нагрузку и сохранить скорость.

Conntour можно развернуть:

  • полностью на локальных серверах клиента;
  • в облаке;
  • или в гибридном режиме.

Платформа интегрируется с большинством существующих систем видеонаблюдения или может работать как самостоятельное решение.

Проблема качества видео — и как её решают

Одна из давних проблем отрасли — плохое качество записи: тёмные, размытые или засвеченные кадры с грязных камер. Это мешает распознаванию.

Conntour решает это с помощью оценки уверенности (confidence score). Если качество видео низкое, система предупреждает: результаты могут быть неточными.

Главная техническая задача — совместить мощность и эффективность

По словам Гольднера, главная техническая дилемма — дать пользователям полную свободу языковых запросов, как в больших языковых моделях (LLM), и при этом не сжигать ресурсы.

«Мы хотим одновременно два противоречащих друг другу вещи. С одной стороны — полную гибкость, как у LLM: чтобы можно было спросить что угодно. С другой — высокую эффективность, чтобы система работала с минимальными ресурсами. Ведь обработка тысяч видеопотоков — это безумие. Это и есть главный технический вызов, над которым мы усиленно работаем»

Читать оригинал