Технология распознавания речи на службе корпоративных интересов.

ЗАДАЧА - СОХРАНИТЬ
С ростом бизнеса и его усложнением, цепочка «создать - приумножить» дополняется третьим ключевым компонентом: «сохранить». Одним из определяющих компонентов безопасности становится предотвращение рисков. Для этого необходим детальный анализ происходящего в компании и вокруг нее - трудоемкая работа по изучению экономических тенденций, финансовых потоков компании, действий конкурентов и контрагентов, внутренней ситуации в коллективе. Эта статья предназначена профессионалам, для которых предотвращение опасных ситуаций – суть самой работы, для кого слово «риск» не пустой звук, а сигнал к оперативному действию.
Когда речь идет о безопасности, каждая деталь может оказаться решающей. Анализ максимального количества факторов и скорость реакции - вот два ключевых требования к работе стражей бизнеса. Для эффективного выполнения этих требований необходимо объединить экспертный опыт с автоматизированными системами, которые возьмут на себя выполнение рутинных задач.
В настоящий момент компании используют широкий набор зарекомендовавших себя средств обеспечения безопасности. Уже не нужно держать штат в 20 охранников: острое зрение обеспечивает система видеонаблюдения и один наблюдатель-эксперт.
Нет необходимости обращаться к системному администратору и кропотливо просматривать icq-сообщения менеджеров - нюх на злонамеренные действия многократно усиливается благодаря системе автоматизированного анализа сообщений. Данные источники угроз давно перекрыты. Но есть один канал, который до недавнего времени невозможно было эффективно контролировать. Этот канал - человеческая речь.
В статье мы расскажем об инструменте, дающем эксперту службы безопасности чуткий слух. Мы как эксперты в области создания коммерческих решений с использованием технологии распознавания русской речи расскажем, как можно поручить машине ресурсоемкую задачу анализа речи и тем самым освободить профессионалу время для максимально эффективной работы по защите бизнеса.

УГРОЗЫ
В муравейнике под названием «бизнес» происходит много важного и интересного: заключаются договоры, оплачиваются счета, отгружается товар, оказываются услуги, приходят и уходят сотрудники, меняются роли в коллективе. Все это легко можно отследить по отчетам отделов продаж, логистики, кадровиков и руководителей подразделений. Сделав этот процесс регулярным, вы сможете «держать руку на пульсе» и, случись беда, достаточно быстро поймете, если что-то не так. Но что если, сделав отчет, бухгалтер не учтет несколько грузовиков с продукцией, что если, по форме доложив руководству, топ-менеджер позвонит конкуренту, что если, отгрузив товар, логист в курилке наберет нужный номер и договорится об откате, что если...
Эти самые «если...» очень сложно отследить. Как вовремя схватить за руку зарвавшуюся личность? И что делать, если еще и ресурсы ограничены?
Недостаточное внимание к рискам (а под недостаточным вниманием мы понимаем нехватку ресурсов на обработку рисково-важной информации) приводит к тому, что очень быстро потенциальные риски превращаются в реальные нарушения и должностные преступления, а это приводит к печальным результатам, начиная от потери репутации и заканчивая прекращением бизнеса.

ФАКТЫ
Приведем несколько примеров из банковской сферы, когда внутренние злоумышленники осуществили махинации, приведшие к существенным убыткам.
- В нескольких московских отделениях Сбербанка в 2006-2007 гг. были выданы кредиты на подставные фирмы на общую сумму 35 млрд. рублей. Просрочка по выплатам всплыла спустя несколько лет. Львиная доля должностных преступлений произошла в трех отделениях: Стромынском, Люблинском и Мещанском. По факту выдачи сомнительных кредитов было возбуждено уголовное дело в отношении организованной преступной группы, состоящей из руководителей одного из отделений «Сбербанка», его подчиненных и сотрудников службы безопасности.
- Общеизвестна история банка ВЕФК-Урал, руководство которого по сговору с главой свердловского отделения Пенсионного фонда России Сергеем Дубинкиным незаконно распорядилось средствами пенсионного фонда, выдав множество необеспеченных залогами кредитов. В результате финансовых махинаций был утрачен почти миллиард рублей, предназначенный для выплаты пенсий.
- В Ростове-на-Дону группа сотрудников филиала Импэксбанка в 2005-2007 гг. «провернула» мошенничество с кредитами на 1,3 млрд рублей. Подозреваемыми в кредитных махинациях оказались руководитель и две сотрудницы ростовского филиала банка. Главное следственное управление при ГУВД по Ростовской области возбудило уголовное дело по части 4 статьи 159 УК РФ («Мошенничество, совершенное в особо крупном размере»).

В вышеперечисленных примерах компании столкнулись с проявлением угроз изнутри. Будь то преступный сговор или должностное преступление - данные случаи стали причиной существенных финансовых потерь, а в случае с банком ВЕФК-Урал - и вовсе привели к потере лицензии.
Подобные события далеко не редкость для современного бизнеса. Это подтверждается и результатами опроса Banking Banana Skins 2010, проведенного недавно Центром исследования финансовых инноваций (CSFI) при поддержке аудитора PriceWaterhouseCoopers (код издания ISBN: 978-0-9561904-9-9).
Компании стран развивающейся экономики (в том числе и Россия) включают ущерб от действий внутренних злоумышленников в ТОП-10 наиболее вероятных рисков. Если быть точным, инсайдерский риск на шестом месте, а перед ним такие риски, как кредитный риск, разница в цене опционов, макроэкономические тенденции, колебания курсов валют, и качество риск-менеджмента.

Рассмотрим теперь несколько случаев, когда отсутствие системы речевой аналитики привело бы к самым печальным последствиям.
Возьмем интересный пример из сферы «продуктовый ритейл», а именно, сговор с контрагентом с целью личного обогащения. В компании работает более 500 человек. В день записывается более 300 часов аудиоданых. Система речевой аналитики используется регулярно, отслеживается риск «Преступный сговор» по экспертному набору слов и фраз и их сочетаний. Среди них слово «интерес». Менеджер по закупкам в целом качественно выполняет свою работу, но почему-то виден определенный перекос в сторону продукции одного из контрагентов (пиво). Закупается очень много товара, чуть больше, чем магазин может вовремя реализовать. Даже зимой, когда спрос на пиво традиционно низкий, объем закупок не падает. В декабре, в канун новогодних праздников, работник в разговоре с поставщиком говорит буквально следующее «в следующем году я хотел бы повысить свой интерес до полутора рублей». Фраза могла бы так и остаться незамеченной, особенно с учетом аврала, который наблюдается в любом продуктовом сетевом магазине в предпраздничные дни. Однако система речевой аналитики нашла в разговоре слово «интерес» и позволила призвать сотрудника к ответу.

Риски не обошли стороной и сферу логистики. Здесь хочется рассказать о ярком случае в работе одного из перевозчиков. Штат компании - 600 человек. Переговоры менджеров (около 200 часов записей в день) автоматизировано анализируются при помощи системы речевой аналитики. В черном списке фраза «если узнают». Как известно, многие фуры, разгрузившись, едут домой пустыми. Нечистый на руку сотрудник быстро осознает свою выгоду от такого нерационального расходования ресурсов компании - и, просто-напросто, начинает работать на себя. Водители фур, конечно, с ним в сговоре. За руку его схватить удалось не сразу - как никак, большую часть переговоров человек вел с мобильного и даже, скорее всего, вне офиса. Но речевая аналитика все равно помогла. При очередной «левой» поставке возникла неожиданная проблема, которая грозила раскрытием всей схемы (водитель не успевал вернуться на склад из-за задержек с приемкой товара). У мобильного телефона банально села батарейка. Пришлось использовать корпоративную связь, злоумышленник вышел в коридор, чтобы его не услышали коллеги, и позвонил сообщнику - водителю фуры. Машина вычислила, как в разговоре он несколько раз произнес фразы: «ты понимаешь, что будет, если они узнают об этом», «это не должно всплыть». Сотрудник уволен.
Человеческий фактор неискореним, и раз за разом внутренний мир сотрудника находит свое проявление в разговоре, а телефон, став основным каналом общения для миллионов, воспринимается многими как воздух, и в острый момент никто и не подумает о том, что его могут услышать.

О ЗАРУБЕЖНОМ ОПЫТЕ ИСПОЛЬЗОВАНИЯ РЕЧЕВОЙ АНАЛИТИКИ
Вопрос: «А что если процесс отслушки автоматизировать?» первыми задали себе сотрудники служб безопасности зарубежных компаний. Ведь машина - это тот ресурс, который обрабатывает информацию, полностью соблюдая тот набор правил, которые заложены в нее при настройке. Собственно, правила обработки и представления информации можно защитить так, чтобы соблюдение принципов внимательности, трудоспособности, объективности и неподкупности было безукоризненным.
Таким образом, подменив человеческий ресурс машиной, мы сможем не только невероятно сэкономить наш текущий ресурс по отслушке, но и обеспечим безукоризненное соблюдение принципов, изложенных выше. Существенное преимущество автоматизированной системы речевой аналитики будет еще и в том, что поскольку на отслушке работает машина, а не человек, то никаких проблем с законностью не будет. Мы сможем автоматически получать информацию о том, какой сотрудник или контрагент представляет опасность.
Спрос рождает предложение, и с начала 21-го века на западном рынке появились системы речевой аналитики. Такие решения осуществляют автоматический поиск по ключевым словам в аудиозаписях, имеющихся в распоряжении службы безопасности, и позволяют оперативно обнаружить потенциально опасные переговоры.
В финансовой отрасли безопасность традиционно находится на самом высшем уровне, так что первыми новинку опробовали банки. Решения установлены в крупнейших западных финансовых организациях, таких как Bank of America, JP Morgan Chase, UBS.
Система дополнила уже имеющийся богатый арсенал средств защиты и позволила отслеживать случаи преступного сговора и выявлять нелояльных сотрудников. В банке UBS во многом благодаря использованию данной системы удалось определить инсайдера, который передавал сообщнику конфиденциальную информацию (сделки проводились в период с 2005 по 2009 год). По данным Интернет-портала Pravo.ru, основным виновником в деле, обвинительный приговор по которому 28 марта 2010 года вынес Федеральный суд Южного округа Нью-Йорка, стал Игорь Потероба, исполнительный директор в UBS Securities LLC.
Обвиняемый передавал информацию сообщникам по e-mail и телефону с использованием кодовых слов. Без использования системы речевой аналитики банк бы продолжил нести существенные финансовые убытки и репутационные потери.

О РЕЧИ И ОБ ОТСЛУШКЕ
Несмотря на серьезные усилия службы безопасности, вероятность рисков высока. Люди постепенно учатся обходить многие существующие механизмы защиты, будь то внутренние регламенты или системы анализа переписки. Делая отчет, отправляя e-mail, люди используют вторичные языковые навыки - навыки письма. На официальных встречах, где каждое слово имеет вес, люди говорят заранее подготовленные фразы. Степень самоконтроля при этом максимальна.
Но когда зрители уходят, на сцену выходит человеческий фактор и люди начинают... говорить! Речь - это идеальное, всегда доступное средство передачи информации. Речь - этот первичный языковой навык, этот неотъемлемый инструмент общения - та самая область, где подноготная человека проявится обязательно, будь то эмоциональный разговор с коллегой, перетирание косточек начальству или срочная весточка внешнему злоумышленнику. Для человека говорить так же естественно, как есть или спать, и чтобы лучше понять, проблемные места в компании, здорово было бы понять, о чем говорят сотрудники, клиенты и контрагенты.

Эксперты службы безопасности давно включили отслушку переговоров в свой набор средств обеспечения безопасности бизнеса. Обычно ведется точечный контроль сотрудников из «группы риска». Регулярная работа создает эффективную среду противодействия рискам. Но давайте задумаемся о недостатках данного подхода.
Основной недостаток - необходимость наличия существенных ресурсов, т.е. людей, которые должны обрабатывать информационный поток. А это обуславливает необходимость введения «колпака» следующего уровня для контроля уже этих людей. Соответственно, чем больше число сотрудников, тем больше необходимость в наблюдающих и выявляющих первого уровня, и тем больше необходимость в наблюдающих и выявляющих второго уровня.
Далее – качество ресурса при анализе речевой информации предприятия определяется следующими факторами:
•Внимательность - постоянство выявления заданной комбинации факторов риска.
•Трудоспособность - способность обработки значительных объемов информации с равным качеством в течение всего рабочего времени.
•Объективность - одинаковое отношение к контролируемой информации, независимо от ее источника. То есть, кто бы ни сказал слово «украсть» - информация об этом будет в отчете.
•Неподкупность - люди слабы и всегда можно найти способ надавить на них, или простимулировать для того, чтобы информация о подготовке преступления не просочилась руководству. Создание многоуровневой структуры безопасности, базирующейся только на человеческих ресурсах - дело со своими собственными рисками, управление которыми - задача нетривиальная.
Очевидно, что сотрудник службы безопасности, каким бы приверженным делу он ни был, и каким бы многолетним опытом он ни обладал, не сможет на 100% соответствовать перечисленным требованиям. Кроме того, строго говоря, «ручная» прослушка записей переговоров незаконна, т.к. ее осуществление без соответствующего решения суда или согласия всех участников нарушает конституционные права гражданина на тайну телефонных переговоров.

КАК РАБОТАЕТ РЕЧЕВАЯ АНАЛИТИКА И ЧТО НУЖНО, ЧТОБЫ НАЧАТЬ ПОЛЬЗОВАТЬСЯ СИСТЕМОЙ
Речевая аналитика - это просто. Работает, как Google или Yandex, только вместо веб-сайтов - записи переговоров в компании, а вместо гиперссылок - указание на разговоры, содержащие ключевые слова. У вас есть архив записей, у вас есть список ключевых слов и фраз. Вам остается открыть окно программы, выбрать нужную часть архива (за день, за неделю, ...) и интересующие ключевые слова. Далее нажать кнопку «Поиск» и получить список переговоров, в которых встретились ключевые фразы. Можно запустить систему и в фоновом режиме, тогда индексация аудиоданных будет осуществляться автоматически.

Для того чтобы приступить к процессу выявления опасных ситуаций с помощью речевой аналитики, необходимо просто установить соответствующее программное обеспечение.
Обычно для отслеживания одного типа риска и обработки 100 часов записей в сутки в компании среднего размера (до 1000 сотрудников) достаточно одного сервера класса HP Proliant DL 160 G5, Intel Xeon 54xx series. На сервере проиcходит обсчет аудиоданных, а работа с результатами производится через терминальные рабочие станции. К ним требования попроще: класс машины - не ниже Intel Pentium IV, монитор, наушники.
Рабочих мест может быть несколько (по числу экспертов). Оператор системы может создать поисковый запрос, обратиться к полученным ранее результатам поиска, посмотреть, какие разговоры система определила как опасные, проаннотировать их. Для обнаруженных подозрительных фрагментов доступна функция воспроизведения.
Решение может адаптироваться под конкретную задачу, а список ключевых слов, доступных для поиска, не ограничен. Компания может выбрать те риски и опасные ситуации, отследить которые важнее всего, а эксперты в области речевой аналитики помогут подготовить такой список слов и фраз, который наилучшим образом поможет вовремя обнаружить и предотвратить угрозу.

ПОДВОДИМ ИТОГИ
Главная задача речевой аналитики - выявление возможностей риска, т.е. анализ записей на наличие информации, свидетельствующей о потенциально опасной ситуации.
Перечислим лишь некоторые примеры угроз, которые помогает выявить данный тип решений:
•Мошенничество сотрудников (слова «интерес», «есть схема»).
•Разглашение сотрудником компании конфиденциальной информации по телефону (отслеживание фраз «по секрету», «обороты»).
•Склонение к преступной деятельности («встретимся», «обсудим»).
•Наличие нелояльных и потенциально опасных сотрудников («надоело», «начальник», «все сложно»).

Точность определения ключевых слов - а, следовательно, и рисковых ситуаций - составляет 90%. При этом уровень информационного шума (так называемые «ложные тревоги» или «ошибки второго рода») настолько низок, что позволяет с сохранением высокой эффективности производить одновременный поиск по нескольким десяткам слов и отслеживать сразу несколько типов опасных ситуаций.
Речевая аналитика используется для предотвращения инсайдерских действий, риск которых постоянно растет с развитием бизнеса. Являясь автоматизированным решением, речевая аналитика лишена проблем, присущих персоналу на этих задачах. Машина не нарушает тайны переговоров, если переговоры не нарушают правил бизнеса, поэтому зона применимости речевой аналитики существенно шире, чем у прослушивания человеком. Речевая аналитика - сложная математическая задача, и качественное ее решение возможно только в результате серьезной научно-исследовательской работы.
Несколько лабораторий есть в нашей стране (при РАН, в СПбГУ), однако даже лучшие разработки ученых далеки от потребностей реального заказчика. Создание эффективного продукта возможно только в связке с клиентом, с его потребностями, а это задача коммерческих организаций. Научная экспертиза компании «Vocative» (два кандидата наук, сотрудничество с Санкт-Петербургским государственным университетом), в которой работают авторы статьи, сочетается с прагматическими наработками (в частности, недавно получен патент №2386178, улучшающий качество распознавания речи) и опытом реализации прикладных проектов в области безопасности. Это позволяет нам уже сейчас предложить рынку систем безопасности эффективное решение по речевой аналитике для русского языка.

Печатается с сокращениями.
Журнал «Директор по безопасности», №11, 2010