В 2017 году Владимир Путин поручил усовершенствовать механизмы независимой оценки качества оказания социальных услуг населению. Примерно с этого времени российские IT-компании делают качественный рывок в сфере распознавания речи, а государство активно вводит курс на цифровизацию всех отраслей. В этом материале мы рассмотрим, как оцифровать речь и получить пользу из огромных массивов данных в социально значимых отраслях
Голосовые помощники как этап цифровизации
Ни для кого не секрет, что при звонках в колл-центры нас все чаще встречает фраза: «Для улучшения качества обслуживания все разговоры записываются». До недавнего времени прослушивание и анализ таких разговоров доверяли группе контроля качества. Это касалось и многофункциональных центров, и медицинских учреждений, и крупных государственных компаний. Однако в последнее время в рамках цифровизации в тех же самых колл-центрах для сокращения нагрузки на операторов и улучшения качества обратной связи все чаще используются голосовые роботы. Задача такого голосового помощника максимально проста: принять звонок, распознать речь гражданина, перевести в текст и, по возможности, самостоятельно дать ответ. В тех случаях, когда робот не может справиться сам – перевести на оператора. Такая технология позволяет существенно сократить затраты на обработку входящих голосовых сообщений от граждан. Давайте разберем в деталях, за счет чего это возможно. Представим среднестатистический регион России в период наступления холодов и подключения теплоснабжения. В это время значительно возрастает количество обращений граждан. Вся эта нагрузка ложится на внутренние номера горячих линий, за которыми, как правило, всего от трех до десяти операторов, принимающих звонки от населения города и размещающих те или иные заявки. В тот момент, когда приходит 20-50 обращений, справиться с такими нагрузкам не составляет особого труда, но когда ситуация становится критической, например, когда теплоснабжение отключено или возникла поломка, количество обращений на горячую линию растет в геометрической прогрессии. Руководители контактных центров часто даже не знают, какое точно количество обращений граждан в день поступает на линию и остается без ответа. Нередко оно может составлять несколько тысяч. Понятно, что ни о какой лояльности населения в эти моменты речи не идет. Специально для решения этих задач и были разработаны голосовые помощники. Во-первых, они позволяют быстро настраивать сценарии диалога на основе тематики входящих звонков. Во-вторых, технология предполагает мгновенное масштабирование и свертывание. Это означает, что если на горячей линии сегодня 50 звонков в день, завтра – две с половиной тысячи, а еще через две недели – снова 50, руководителю не нужно подбирать, обучать и сокращать персонал в такие сжатые сроки. Достаточно просто добавить количество виртуальных машин, которые обработают все обращения. Кстати, роботы отвечают автоматически синтезированным голосом, который в настоящее время уже максимально напоминает человеческий. Такие голосовые помощники уже появились на крупных городских порталах, в ряде корпораций и у ведущих сотовых операторов.
Опыт их применения показывает, что технология востребована, и следующий шаг – применение её в социальных сферах, например, в здравоохранении (в частности, для повышения эффективности борьбы с ковидом), в филиалах Пенсионного фонда, в многофункциональных центрах предоставления государственных и муниципальных услуг и т.д. Выступление Президента в октябре 2020 г. о предоставлении бесплатных лекарств просто обрушило линии Минздрава в некоторых регионах. Граждане не могли дозвониться и получить обратную связь с информацией о том, как это сделать. Для предотвращения возможных всплесков недовольства со стороны населения в подобных ситуациях руководство субъектов Российской Федерации сейчас активно изучает вопрос интеграции голосовых помощников.
Однако речь граждан встречается не только в виде голосовых обращений на горячие линии, но еще и во время физического присутствия в госучреждениях. Существуют ли высокотехнологичные решения для оценки качества обслуживания и выявления тематики обращений граждан на местах?
Речевая аналитика. Отечественная разработка
На сегодняшний день уже несколько компаний ведут разработку отечественных платформ речевой аналитики, которые эффективно справляются с записью и анализом речи граждан во время их визитов в госучреждения и позволяют мгновенно осуществлять семантический анализ поступающих запросов. Тесты уже прошли в Бурятии, Чеченской Республике, Орловской области. На сегодняшний день эти регионы идут в авангарде цифровизации по вопросу аналитики речи.
Как это работает?
В местах приема граждан на рабочие столы сотрудников устанавливаются специальные микрофонные решетки, которые позволяют эффективно записывать речь посетителя во время взаимодействия с сотрудником (например, многофункционального центра), далее разделять эту речь по голосам и транскрибировать ее в текст.
Количество возможных применений огромно: например, система позволяет проанализировать речь сотрудников на соответствие стандартам обслуживания, определить, какие обращения вызывают наибольшие затруднения в работе оператора. Все это делает работу сотрудника максимально прозрачной, а управление для руководителя – максимально эффективным. Любая запись может быть найдена и прослушана как с поиском по времени, так и с поиском по ключевому слову. Система идентифицирует слова – признаки конфликтов или благодарности, основные вопросы и максимально эффективна при защите от потребительского экстремизма (что уж греха таить, бывают и такие случаи). Установка таких систем анализа максимально дисциплинирует как сотрудника, так и гражданина во время диалога. Однако, помимо анализа речи сотрудника, существует и еще одна, не менее важная функция – технология позволяет мгновенно анализировать наиболее частые темы обращений и, минуя персонал первой линии, поднимать информацию наверх, для принятия оперативных управленческих решений. Сейчас для сбора тем, которые волнуют население, применяются опросы. Информация собиратеся специалистами вручную, во время звонка или визита граджанина.
Далее она передается руководителям на местах, а те, в свою очередь, отчитываются о происходящем на совещаниях в правительстве городов и субъектов. Мало того, что такой подход очень затянут по времени, так он еще и вызывает большие сомнения в точности данных, так как на сбор и анализ информации влияет человеческий фактор. В случае с анализом речи данные поступают мгновенно. Например, руководители ЖКХ могут видеть, что еще вчера жалоб на скользкие тротуары не было совсем, а сегодня их уже более 150. Точно также можно анализировать спрос на продовольствие, медикаменты, теплоснабжение, оценивать качество ремонта подъездов, дорог и т.д. В таких условиях технология распознавания речи становится мощными примером цифровизации и индикатором «продвинутости» субъекта в данном вопросе.
В чем преимущество?
Давайте представим выгоды технологии распознавания речи со всех сторон. Если мы говорим о руководителях многофункциональных центров или отделений Пенсионного фонда, где работает большое количество персонала первой линии, то у них, безусловно, остро стоит вопрос подготовки кадров и соответствия этих кадров выполняемым процессам. Существуют технологии, которые позволяют, единожды обучив сотрудника, уже с первого дня давать ему объективную адресную обратную связь. При транскрибировании 100% речи появляется возможность показать, что сотрудники говорят, а что забывают, или при какой тематике обращений обслуживание посетителей занимает неоправданно длительное время. С другой стороны, данная технология защищает сотрудников от потребительского экстремизма, когда граждане приходят на прием, заведомо используя ложную информацию о том, что им что-то неправильно оформили или что-то не так до них донесли. Распознавание речи способно защитить граждан от некачественного оказания услуг, низкого уровня сервиса и ошибочно данной информации при обслуживании в государственных учреждениях. Все мы помним ситуацию, которая произошла в декабре 2020 г., когда на пресс-конференции Владимира Владимировича Путина прозвучал вопрос жителя Волосовского района о хамстве чиновников. Гражданин Анатолий Николаевич Терехов обратился за помощью в Пенсионный фонд в городе Волосово, но ему не только не оказали необходимую услугу, но и нахамили в ответ. Это является ярким, но одним из бесчисленного количества случаев, когда госучреждения, а в их лице, как следствие, местные и федеральные власти несут репутационные риски из-за одного некомпетентного чиновника.
Такие кейсы очень легко разбирать и давать объективную оценку происходящему, вставая на сторону гражданина или же, наоборот, на сторону государственного учреждения, объективно анализируя ситуацию. Ниже пример того, как может выглядеть статистика для руководителя, которому достаточно лишь раз в день заглянуть в аналитический отчет, чтобы понять, о чем и как именно разговаривают сотрудники. В то же время семантический анализ показывает, что граждане упоминают чаще, а что реже. Давайте поподробнее рассмотрим кейсы применения распознавания речи в отраслях.
Речевая аналитика – применение в отраслях
20 августа 2019 года Владимир Владимирович Путин призвал провести работу по модернизации первичного звена в медицине. Глава государства также считает необходимым «обеспечить цифровизацию сферы здравоохранения с использованием технологий искусственного интеллекта в работе медучреждений на всех уровнях». Сейчас при составлении статистики обращений к специалистам учитываются лишь фиксированные записи о выданных талонах или проведенных приемах. Сколько было попыток записаться к тем или иным специалистам – не учитывается. Из этой необъективной оценки и возникает нехватка некоторых узких специалистов (особенно в регионах), так как время приема у них ограничено и количество талонов к ним – тоже. В таком случае технология распознавания речи позволяет увидеть не просто факт записей к специалистам, но и количество реальных обращений. Кроме того, при современной скорости приема врачей у них возникает необходимость очень быстро выписывать рецепты. Для того, чтобы не заставлять писать врачей со скоростью пишущей машинки и при этом не совсем понятным почерком, есть возможность транскрибирования речи в текст. Это существенно разгружает специалиста во время приема. Та же самая ситуация касается и сотрудников МВД, когда им приходится заполнять огромное количество протоколов. В зданиях судов или на часто проводимых совещаниях, везде, где есть персональные микрофоны за совещательными столами, технология позволяет разделить голос на звуковые дорожки, закрепить персонально за каждым спикером и транскрибировать с точностью 80-90 процентов. А это означает, что нет необходимости набирать текст с самого начала, достаточно просто его адаптировать и привести к конечному виду. Практика показывает, что технология позволяет примерно в 3 раза сократить затраты на написание текстов. Кстати, этим могут пользоваться и журналисты. Что касается учебных заведений, здесь технология распознавания речи также применима. Все острее встает вопрос о создании общероссийского банка лекций, который позволил бы учащимся средних и старших классов, а также студентам осуществлять поиск материалов преподавателей со всей России по ключевым словам или нужной дате. В то же самое время это позволило бы изучать лучшие практики ведущих преподавателей страны и ориентироваться на них всем остальным. Это, безусловно, беспрецедентный обмен данными, когда учитель из села имеет возможность здесь и сейчас ознакомиться с трудами педагогов с разных концов страны. Это позволило бы повысить профессионализм учителей и преподавателей с минимальными затратами и в конечном итоге усовершенствовать систему образования. Речевая аналитика находит своё применение и в Центрах управления регионами, непосредственными задачами которых являются информационно-аналитическая поддержка процедур и процессов, позволяющих руководителям принимать эффективные решения по управлению возглавляемыми структурами, формирование стратегии их развития, а также предотвращение или устранение кризисных и чрезвычайных ситуаций. Итак, транскрибация и анализ 100% речи сотрудников и граждан во время приема в государственных учреждениях явно приобретают практический смысл, позволяя принимать оперативные управленческие решения на местах, видя запросы населения, делая жизнь российских граждан лучше, а работу исполнительных органов – прозрачнее. Потребность в речевой аналитике уже давно назрела в огромном количестве отраслей.
Василий Менцик