Видеосистемы генерируют большой объем графической информации, однако экономически нецелесообразно осуществлять мониторинг и оценку всего объема этой информации вручную. Обычно на предприятиях, где используется большое количество камер, мониторинг осуществляет небольшое количество операторов. Постоянный просмотр изображений всех камер - это просто неэффективное использование ресурсов персонала, так как люди в один момент времени отслеживают множество изображений, вследствие чего операторы быстро утомляются. При потере концентрации важные детали упускаются, что существенно подрывает общую идею обеспечения безопасности. И, это создает только видимость безопасности.
Для того чтобы исправить эту ситуацию, нужно выделить релевантную информацию из общего объема данных. И, к счастью, алгоритмы анализа прекрасно справляются с задачей постоянного мониторинга картинки в необходимом вам объеме, а также автоматического привлечения внимания оператора к критическим ситуациям. Алгоритмы и процессоры не знают, что такое «усталость», они автоматически работают в фоновом режиме 24 часа в день, 7 дней в неделю, совсем как идеальный помощник.
Естественно, система не должна безосновательно генерировать множество сигналов тревоги, иначе оператор перестанет отрабатывать их как критические ситуации и начнет просто отменять сигналы тревоги без должной проверки. Тогда результат будет примерно такой же, как в случае отсутствия анализа изображения - операторы теряют концентрацию, при этом легко пропустить реальные ситуации тревоги, а система просто создает внешнюю иллюзию безопасности.
Определение задачи
Таким образом, если вы хотите, чтобы система анализа изображения работала действительно эффективно и надежно, важно четко определить так называемую «критическую ситуацию» и идеально соответствующий ей алгоритм. Точно также как и в любой отрасли бизнеса, для того, чтобы качественно выполнить работу в соответствии с ожиданиями руководства, необходимы четкие инструкции и правильно подобранные средства. Если задачи поставлены недостаточно четко или требуют навыков, которыми помощник не обладает, именно в этом и будет находиться источник всех проблем.
В рамках маркетинговых кампаний, проводившихся в последнее время на рынке CCTV, продвигались весьма радикальные утверждения о возможностях та к называемого «интеллектуального» видеоанализа. В результате многие пользователи полагают, что алгоритмы анализа обладают человеческим интеллектом. Они считают, что раз они сами своими глазами могут увидеть, что на картинке ползущий человек, а не идущая на 4 лапах собака, то, безусловно, и алгоритм должен быть в состоянии отличить человека от животного. Если бы все было так просто!
На самом деле, в большинстве алгоритмов используются относительно упрощенные критерии различения, например, транспортных средств и людей от других движущихся объектов и т.п. В первую очередь они реагируют на движение в картинке: если на картинке присутствует группа близкорасположенных и систематизированных пикселей (то есть присутствующих на нескольких последовательных изображениях), которые перемещаются из одной части картинки в другую, тогда алгоритм делает заключения, что эти пиксели относятся к однородному объекту. Затем идет проверка по критериям, например относительной размерности объекта. Если высота объекта превышает его ширину и приблизительно равна размерам человеческого тела, тогда система предполагает, что этот объект является человеком и предпринимает соответствующие действия. Если в этом случае система должна подавать сигнал тревоги, она именно это и делает.
Но для того, чтобы алгоритм пришел к такому логическому заключению, в него необходимо заложить информацию о размерах человеческого тела на изображении, когда человек находится на переднем плане, и о размерах тела, изображенного на заднем плане. Все это делается в процессе настройки, когда сервисный инженер «измеряет» экран для определения ширины переднего и заднего планов. Человеку, смотрящему на экран, не нужно детально объяснять такие подробности. Он просто понимает информацию по контексту.
Очень простые алгоритмы классификации, как этот, идеально подходят для некоторых приложений. Однако в ситуациях, когда велика вероятность, что люди будут добираться до площадки наблюдения не в строго вертикальном положении (как раз с целью не быть обнаруженными), этот тип алгоритма абсолютно не подходит, а значит, безопасность объекта находится под угрозой.
Сегодня существует большое количество алгоритмов, при помощи которых возможно решить множество задач. Для обеспечения действительно надежной помощи, выбранные алгоритмы должны быть приспособлены для конкретной задачи и должны быть идеально настроены. Чем сложнее его процесс обработки данных и короче время реагирования, тем большая мощность обработки потребуется.
Централизованно или децентрализовано
Многие производители камер поставляют оборудование с уже встроенными алгоритмами. Эти производители поддерживают систему децентрализованного анализа видео, когда анализ производится на периферийном оборудовании системы, а не на основном сервере. У такого способа организации анализа есть одно преимущество: анализируется несжатые данные изображения, что обеспечивает надежный анализ. Этот так называемый «периферийный» анализ также позволяет экономить пропускную способность и сократить требования по производительности центрального компьютера.
При использовании IP камер и централизованном анализе изображений, все данные перед тем, как они будут переданы в сеть, сначала сжимаются, а потом направляются на сервер, который разворачивает сжатые данные и анализирует их. К сожалению, это может привести к тому, что искусственное сжатие негативно скажется на анализе. А, кроме того, это неизбежно означает загрузку сети графическими данными, которые не содержат какой-либо важной информации, при этом разворачивание этих данных создает дополнительные требования к вычислительной мощности центрального сервера.
Но и у централизованного анализа есть свои преимущества. Он более гибок в отношении используемых алгоритмов - часто это принципиально важно для решения специальных задач, а также он требует меньшей вычислительной мощности камер, а значит можно использовать более дешевые камеры.
При разработке централизованной системы важно учитывать масштабируемость вычислительной мощности. В идеале у вас должна быть возможность запускать алгоритм анализа и на центральном сервере управления видео, и на удаленных компьютерах, предназначенных для анализа, которые связаны с центральным сервером управления.
И тот, и другой?
Часто наилучшим решением является сочетанием различных типов архитектуры. Возможно, вы захотите использовать систему предварительного анализа в камере, чтобы отслеживать перемещения на первом этапе (сегодня такая функция предлагается практически в каждой IP камере почти в каждой ценовой категории), затем отправлять отобранный видеоматериал на центральный аналитический компьютер, который исследует эти изображения при помощи специализированного или более сложного алгоритма. Этот второй процесс отфильтровывает данные о перемещениях не относящихся к критической ситуации и гарантированно сообщает о ситуациях соответствующих требованиям. Принимая во внимание, что мы не наблюдаем постоянного движения одновременно на всех камерах, пропускную способность сети и вычислительную способность центрального сервера можно разделить между несколькими камерами.
Для многих приложений сочетание нескольких различных алгоритмов в одном канале может быть полезным или даже необходимым. Эта идея лежит в основе так называемых «дублированных сенсоров» (Dual-Sensor), которые параллельно управляют двумя различными процессами распознавания, при этом сигнал тревоги подается только в том случае, если оба сенсора одновременно зафиксировали критическую ситуацию. Механизмы распознавания основаны на различных принципах анализа, которые реагируют на различные факторы тревоги. За счет сочетания в единой системе двух алгоритмов мы исключаем реакцию системы на незначительные факторы, которая может возникать при использовании только одного алгоритма.
С другой стороны, может возникнуть потребность в использовании различных специализированных алгоритмов в одном изображении, например, для того чтобы надежно выявлять критические области движения и точно распознавать оставленные предметы. Так как эти два приложения предъявляют различные требования к алгоритму, логично использовать два различных специализированных алгоритма для получения наилучших результатов.
Резюме
Видеоанализ - это существенное логичное дополнение к современным системам безопасности, использующим видеонаблюдение, особенно когда он облегчает работу оператора, обеспечивая надежную поддержку. Однако, и это часто встречается на рынке систем безопасности, на вопросы типа: «Какой алгоритм самый лучший?» или «Видеоаналитика в камере или на центральном сервере?» Нужно отвечать: «Все зависит от ситуации!»
Таким образом, удостоверьтесь, что вы получили множество консультаций экспертов. Настаивайте на тестах с использованием видеоматериала на вашем собственном приложении и выбирайте систему, которая гибко поддерживает различные структуры и алгоритмы - и централизованно, и на периферийной камере, а также параллельно. Наиболее точный выбор - это масштабируемая система, которая способна адаптироваться к изменяющимся требованиям и перспективным разработкам. В конце концов, кто знает, может быть когда-нибудь алгоритмы видеоанализа действительно станут «интеллектуальными»!
Автор – Christoph Hoffmann, руководитель Департамента стратегического развития компании «Geutebruck».