Индустрия видеонаблюдения сегодня в центре внимания — и не всегда в лучшем свете. Скандалы вокруг того, как U.S. Immigration and Customs Enforcement использует сеть камер Flock, или как производитель домашних камер Ring добавляет функции, позволяющие полиции запрашивать отснятый материал у жильцов, подогревают споры о безопасности, приватности и том, кто кого контролирует.
Но споры не отменяют рынок. А развитие моделей машинного зрения и языковых ИИ (vision-language models) только ускоряет рост компаний, которые предлагают новые способы отслеживать происходящее на территории предприятий и организаций.
Матан Гольднер (Matan Goldner), сооснователь и CEO стартапа Conntour, говорит, что этические вопросы для них настолько важны, что компания тщательно выбирает клиентов. Для стартапа возрастом меньше двух лет это звучит как сомнительная бизнес-стратегия, но у Conntour уже есть крупные заказчики — в том числе государственные и публичные компании. Среди них, например, Центральное бюро по борьбе с наркотиками Сингапура.
«Наличие таких крупных клиентов позволяет нам выбирать. Мы полностью контролируем, кто использует нашу систему, в каких целях, и можем отбирать только те кейсы, которые считаем моральными и, конечно, законными. Мы используем собственное суждение и принимаем решения, зная, как клиент будет применять наш продукт»
Такой подход не только помогает сохранять этические стандарты, но и привлекает инвесторов. Недавно Conntour закрыла семяную ($7 млн) инвестиционную раунду с участием General Catalyst, Y Combinator, SV Angel и Liquid 2 Ventures.
По словам Гольднера, раунд был закрыт всего за 72 часа. «Я назначил около 90 встреч за восемь дней. Но уже через три дня — начали в понедельник, а к среде закончили», — рассказал он в эксклюзивном интервью TechCrunch.
Как работает ИИ-поиск по видео
Conntour создаёт платформу, которая позволяет сотрудникам службы безопасности искать по видеозаписям с камер с помощью естественного языка — как в поисковике. Например: «Найди, когда человек в кроссовках передавал пакет в холле». Система мгновенно просканирует все архивные и прямые трансляции и выдаст релевантные фрагменты.
В отличие от старых систем, которые ищут по жёстким правилам (например, «движение в зоне А»), Conntour использует модели машинного зрения и языковые ИИ, что делает поиск гибким и интуитивным.
Платформа не только отвечает на запросы, но и:
- выдаёт текстовые ответы с прикреплёнными видео;
- автоматически формирует отчёты об инцидентах;
- самостоятельно отслеживает угрозы по заданным правилам и присылает оповещения.
Масштабируемость — ключевое преимущество
Главное отличие Conntour от конкурентов — масштабируемость. Платформа рассчитана на системы с тысячами камер. При этом она может обрабатывать до 50 видеопотоков на одной потребительской видеокарте — например, на Nvidia RTX 4090.
Достигается это за счёт умного выбора моделей: система определяет, какие алгоритмы использовать для каждого запроса, чтобы минимизировать нагрузку и сохранить скорость.
Conntour можно развернуть:
- полностью на локальных серверах клиента;
- в облаке;
- или в гибридном режиме.
Платформа интегрируется с большинством существующих систем видеонаблюдения или может работать как самостоятельное решение.
Проблема качества видео — и как её решают
Одна из давних проблем отрасли — плохое качество записи: тёмные, размытые или засвеченные кадры с грязных камер. Это мешает распознаванию.
Conntour решает это с помощью оценки уверенности (confidence score). Если качество видео низкое, система предупреждает: результаты могут быть неточными.
Главная техническая задача — совместить мощность и эффективность
По словам Гольднера, главная техническая дилемма — дать пользователям полную свободу языковых запросов, как в больших языковых моделях (LLM), и при этом не сжигать ресурсы.
«Мы хотим одновременно два противоречащих друг другу вещи. С одной стороны — полную гибкость, как у LLM: чтобы можно было спросить что угодно. С другой — высокую эффективность, чтобы система работала с минимальными ресурсами. Ведь обработка тысяч видеопотоков — это безумие. Это и есть главный технический вызов, над которым мы усиленно работаем»