58同城智能语音质检系统:语音识别与NLP技术提升销售客服质量 企业网站的搜索引擎优化研究


介绍

有成千上万的销售和客户服务人员,每年致电数百万小时。我们已经建立了一个智能的语音质量检查系统,使用语音识别技术将语音转换为文本,然后使用NLP技术进行呼叫文本。分析和采矿以实现自动机器质量检查,可以标准化销售和客户服务工作并提高客户服务质量。该主题将首先介绍语音质量检查系统的整体体系结构,然后详细分享语音处理和语音质量检查涉及的NLP技术,包括单声道语音分离,角色识别,文本标签挖掘等。最后,我们将介绍58个销售。语音质量检查申请案例在客户服务方案中。

嘉宾简介:AI实验室算法的高级工程师Chen Lu于2018年9月加入58。她目前主要负责语音质量检查和语音机器人算法研发。他于2016年毕业于北京邮政与电信大学,并在工作,从事产品评论挖掘算法研究与开发。

目录

1。背景简介

2。整体体系结构

3。核心功能

4。业务案例

1个背景简介

什么是语音质量检查?

传统的语音质量检查通常是指质量检查员收听一定比例的电话录音以进行手动质量检查,以检查代理在通话过程中是否违反了法规和非标准演讲。

简介通话中心

的呼叫中心是代理商与客户之间的重要桥梁,并进行了代理商和客户之间的大部分呼叫。它支持成千上万的销售和客户服务的工作,每年的电话次数可以达到1亿多,电话时间持续数百万小时。这个规模是整个行业中非常巨大的数据。

如何在上进行手动语音质量检查? 58个手动语音质量检查中有一个特殊的质量检查团队。质量检查团队将下载呼叫中心录制的录音,并手动收听。聆听时,它将根据自己的理解记录座椅是否有一些违规和非标准。修辞。这种效率非常低。统计后,普通人每天可以收听大约三个小时的录音。

传统人工质量检查具有以下四个缺点:

首先是采样检查小于1%,覆盖率特别低,并且实际上没有质量检查大量语音数据。第二个是质量检查标准不一致。许多质量检查员根据他们在质量检查期间的理解来记录此席位中存在的问题。这可能会导致不一致的质量检查标准,并在后期建立一定程度的治理。麻烦。

第三,很难检测到很多风险信息。主要原因是采样不足,尚未绘制大量风险信息。

第四,质量检查效率非常低,人工成本也很高。

根据这些传统人工质量检查的缺点,我们创建了一个智能的语音质量检查系统,并且整个过程如上图所示。首先,我们将实时收集语音录音,并将语音转换为文本。然后,我们将根据我们的质量检查模型进行质量检查,最后在网络平台上显示质量检查结果。 Web平台上的重新检查人员将进行手动重新注射,并向相关主管进行重新检查结果。整个型号是全尺寸的机器质量检查以及手动重新检查。与传统的人工质量检查相比,它具有以下好处:

首先是对所有录音进行质量检查。 每年都有数百万小时的语音数据,并且可以完全检查这些数据。

第二个优势是实时反馈。录音是实时检查质量后,数据将直接显示在网页上,质量检查人员可以及时进行跟进和重新检查,重新检查结果将同步到主管及时的座位。

第三个是准确的风险标识。因为它是机器检查,因此有必要制定非常清晰的质量检查规则,然后使用机器来识别它们,以便质量检查结果将更加准确,更统一,并且在后期更容易量化。

第四个是它需要少量的手动重新启动,并且是有效的。我们的模型是机器质量检查以及手动重新检查。机器质量检查不需要人工成本,但是只有手动重新检查需要一些人力,这可以极大地提高效率。

2个整体体系结构

这张图是整体体系结构,我们可以看到最核心是逻辑层。逻辑层包括扬声器角色识别,语义标签和语音评分,它们等于我们整个项目的大脑,并且与其他模块相关。首先,访问层访问语音数据,然后调用基本服务层的语音分离和语音识别模块,以将其简化为文本,然后逻辑层开始相应的质量检查工作。质量检查完成的数据将显示在网络质量检查平台上。同时,编辑将对质量检查结果进行标记,评估和后续分析。

3个核心功能

接下来,让我们在整个质量检查过程中介绍核心技术,首先是语音分离和语音识别模块。语音识别是必要的模块,但是为什么要使用语音分离?这涉及即将发出的呼叫中心。它的设备是单声道,座位和客户的演讲在同一频道上,因此无法区分它们。如果您直接识别语音识别,则将获得代理商和与客户叠加的语音内容,并且更难进行随后的质量检查。因此,我们将首先进行语音分离,将座椅与客户的声音分开,然后执行语音识别。语音分离的评估指数是DER分离错误率,语音识别的评估指数是CER单词错误率。在这里,我们主要引入语音分离。

上面的图片很好地说明了语音分离和语音识别。在单声道上,您可以看到紫色条纹,座椅和客户的话混合在一​​起。语音分离后(第二个框图),将其分为扬声器A和扬声器b。最后,通过语音识别,第二个框图下方的句子被翻译。但是,在完成语音识别工作后,说话者A和说话者B仍然不知道哪个是座位,哪个是用户,因此也有必要确定说话者A和扬声器B的角色(这将是稍后介绍)。

单声语音分离

单声音分离的评估指标是分离错误率。分隔错误率的计算公式为:识别错误的音频持续时间/总持续时间的总和。右下角的图片中有两个声音,一个是标准集,另一个是测试集。标准组中有两个字符,扬声器A和扬声器b。但是,在分开声音后,将获得这样的测试集。您可以看到测试集与语音分离的分离与标准集不同。其中,错误,错过,都是错误的声音。语音分离的目的是最大程度地减少这三种错误的声音的持续时间。

上图显示了语音分离的整个过程。演讲后,您将首先使用VAD打破人声,识别人声,然后对人声进行矢量化,最后将向量聚集以形成两种类型的扬声器A和扬声器b。 VAD句子是的开源,它在我们的语音分离方案中取得了良好的结果。

第二步是使用34层VGG残差网络的音频转向矢量。我们尝试了矢量聚类中的各种聚类解决方案,最后选择了聚类。这是我们在VAD调音和音频转向向量方面的一些经验。

VAD调音

在VAD调整中,我们主要在两个方面进行调整以取得更好的结果。一个是框架移位,另一个是碎片合并。

对于框架移动,我们尝试了较小的框架移动,以便我们可以获得更细粒度的语音表示和更准确的人声识别。

第二个是剪辑的合并。底部图片是编辑的声音情况,但是在制作VAD句子时,它将被分成较小的剪辑。这些较小的碎片将减少DER,因此我们将其合并。

音频转向矢量

我们还尝试了音频转向向量的大量工作。这是使用34层VGG残差网络获得音频转向向量的最终方法。这是2019年顶级芒本报纸发布的网络。其最初的任务是一项语音识别任务,该任务确定了n个扬声器。我们将该模型的最后一层的输出直接用作相应的音频向量。

在整个语音质量检查过程中,我们首先将扬声器分开,然后使用语音识别来获取左侧的两个文本,即扬声器A的文本和扬声器的文本b。下一步是判断演讲者。 A是代理商或客户,因此需要进一步的操作,这是角色识别。我们的目标是在左侧的两个文本堆上识别他们的角色。

总体过程显示在右侧的图中。在获得语音分离和语音转录的结果后,我们将首先执行性别认可。如果我们发现这两个扬声器属于异性,我们将直接检查席位的性别,然后我们可以知道客户的性别。这样,在我们认识到每个声音之后,我们就可以知道他的角色是座位还是客户。如果我们发现自己是同性的,我们将进行另一个过程。首先,我们最初将判断说话者A和说话者B的身份,然后进行单句话校正以实现相对完整的角色识别。

最初的角色分配,我们还基于先验知识,通常在通话过程中在座位上讲很多事情。以左侧为例,如果说话者B有更多单词,我们会认为说话者B是座位和扬声器A是客户。基于这样的先验知识,在我们做出初步的决策和分配之后,我们会发现,由于说话者的早期语音分离,会出现某些分离错误,从而导致错误的级联,并且某些单词角色将识别错误以及整体。因此,我们还需要进行单一句子的角色校正工作。例如,经纪人说“我是的人”,他被分配到客户的这一边。然后,当我们纠正单一句子角色时,我们将纠正该句子为代理。

主要角色识别模型

这是我们的性别识别模型和单句话角色校正模型。性别识别模型我们使用 +BI-LSTM +,性别模型的识别精度为92%。在执行单句话校正时,我们最终使用了两层BERT。在我们的训练场合中,我们发现两层Bert不仅比12层BERT具有更好的结果,而且还大大提高了推理速度。 ,更方便我们在线推理。

质量检查算法

接下来,我们将介绍最核心质量检查算法模块。我们的大多数质量检查工作是检查座位上是否有一些违规或非标准的单词。我们可以将其抽象成NLP中的分类任务,在其中的质量检查算法中,分类模型占很大比例的。由于58拥有许多业务线路,因此每个业务线路都会抽象不同的标签,并且不同业务线的数据不同,并且我们使用的模型也将进行相应调整。在这里,我们主要分享销售业务系列的质量检查算法。销售工作是与某些客户交流并推广产品。在此过程中,可能会有一些非标准的演讲和一些非法行为。因此,我们从销售质量检查中提取了一些标签,例如投诉,侮辱和过度承诺。

我们的质量检测模块主要用于在一个句子中识别它。我们一开始使用的模型是,为什么我们选择此模型?有两个主要考虑因素:一个是我们标签的粒度不会太长,而且基本上是同一句子。例如,投诉标签基本上是一个陈述“我要向您投诉”和“如果您这样做,我会去相关部门起诉您”,可以在文本部分中确定,所以我们使用了它。第二点是,由于我们获得的文本以语音转录,因此会有一些ASR传输错误。对于具有更多ASR错误的文本,LSTM等模型的某些效果不如我们中的那些效果,因此我们将使用第一个版本。我们还将使用自己的业务数据预先培训SPTM模型。

SPTM模型是我们开发的模型。它的全名是预模型,我们于2019年4月开发。使用SPTM模型后,准确的动作已在一定程度上改进,并且目前是最有效的模型之一。在线推理的时间也很少,单层SPTM推理仅需12毫秒,评估效果与Bert-Base相同。

SPTM模型

SPTM型号于2019年4月出生,并根据BERT进行了一些更改,该BERT于2018年10月底出生。左侧的图是Bert,其中包括两个任务,一个是预训练,另一个是微调。我们进行的更改主要包括两个点。一种是用BI-LSTM替换它们,第二个是删除NSP任务。以上是我们SPTM的开源地址。如果您有兴趣,可以使用它。只需对自己的业务数据进行一些预培训,以在下游数据上产生良好的结果。

这是SPTM的详细介绍。 Bert-Base使用末端,这是由12层制成的堆栈。预训练的任务包括两个,一个是MLM,另一个是NSP任务。我们删除了该领域的NSP任务,以前的任务与BERT一致。除了更换每个块外,我们块的其他部分与伯特一致。

SPTM的优点是,预训练的模型具有快速的推理速度,缺点是其表达能力在某些复杂的任务上略有下降。例如,其表达能力在某些阅读任务中不如BERT好。但是在一些简单的任务中,例如一些常用的文本匹配,分类和序列标记任务,结果相对较好。

单句标签

对于单句标签,我们还尝试了其他一些模型。其中是一个相对典型的。它是在2019年9月提议的。与Bert相比,它对以下三个优化进行了优化:

第一个是嵌入向量的单词,它使用分解,并且参数的数量大大减少。第二个是跨层参数共享。跨层参数共享不会对其信息处理功能造成太大损害。第三是段落的连续性任务。我们积累了大量的ASR转录文本,因此我们使用自己的业务数据预先培训两层。模型参数量不仅大大降低,推理速度也更快,而且其训练速度也加速了。我们的业务数据与SPTM基本相同。

全局标签

除了单句标签外,我们还拥有一些使用全局标签的业务,例如上面的示例。在左边的这次对话中,客户有时会问:“获得营业执照需要多长时间?”目前,客户服务应该回答这个问题,但是一些客户服务会回答:“我不太了解,请向其他人提出问题。” ,这实际上是逃避责任的体现。我们的目标是认识到这种声音,但是如果我们只认识到“我不太了解”,则很容易造成意外伤害。因此,我们将结合上下文信息以识别它。

质量检查模块通常需要探索一些规则以发现数据分布规则,以便我们可以进行一些分析和规则制定。我们使用的是两种常见的规则挖掘方法:一个是ngram规则挖掘,另一个是新单词发现。

Ngram规则挖掘,其主要功能是发现一些对阳性示例样本敏感的规则,并且基本过程如上图所示。例如,有一个说法:“如果生病了几次,您尝试过多少次?”我们将首先提取其ngram数据,然后我们将分别计算出正面和负面示例的文本中出现的ngram的数量。如果在阳性案例中发生的次数远远超过负面案例的次数,那么我们认为这是对积极案例敏感并将保留的规则。它适用于注释文本分为正面和负面示例的情况。例如,在像侮辱这样的情况下,我们将使用它来发现对侮辱敏感的规则,从而提高了召回和准确性。

挖掘规则的另一种方法是发现新单词。当我们进行文本处理时,我们将进行一些单词切割工作,但是在剪切单词时有一些固定的表达式,并且一些常用的表达式不在词汇库中。单词滴答的粒度很好。但是我们想获得更长的粒度,以形成语义上易于理解的内容,因此我们使用了新单词。首先,将在语料库上执行正常单词分割,然后使用点共同信息选择替代单词,然后将根据其左右熵选择新单词。

以上是对我们整个核心技术的介绍。在对语音翻译的文本进行了质量检查之后,质量检查结果及时与Web质量检查系统同步,并且网络质量检查系统将显示出来。

这张照片是网络质量检查系统的屏幕截图。这个示例是客户说他想抱怨的时候。我们检测到这个风险点并将其放在网络系统上。重新检查人员将进行重新检查。如果您抱怨这真的是一个,他将单击以确认。如果这是错误的判断,他将修改标签并将其更改为普通标签。

我们还将标记和评估质量检查数据,将带注释的结果添加到培训数据中,不断优化我们的模型并改善质量检查效果。

评估将在质量检查后首先采样结果。抽样后,一个特殊的质量检查团队将标记它,还将对明显结果进行手动质量检查。质量检查的目的是确保标记数据的准确性,并最终形成评估集以进行评估。当前的总体准确率为92%。在收入方面,我们的呼叫中心已将所有记录与质量检查联系起来,其中客户服务质量检查节省了约1000人。

4个业务案例

第一种情况是对高风险销售记录的质量检查,即判断在销售和客户之间的沟通过程中是否发生过一些高风险行为。首先,我们制定了一系列标签,分为高风险标签和普通标签,其中我们将更多地关注高风险标签,因为高风险标签为用户带来了非常差的经验,并且也可能会带领向用户投诉。

质量检查系统将质量检查这些标签和重新检查人员将进行重新检查。这些重新检查的结果将传递给销售主管,后者将选择一些处理措施。例如,如果将这些手机放入无声数据库中,或者手机受到180天的保护,则无法在180天内调用销售,从而形成更好的反骚扰机制以保护客户免受骚扰。

第二种情况是呼叫中心风险控制和反骚扰。这基于历史语音数据,以预测高风险呼叫以减少客户投诉。由于我们的语音质量检查已在一段时间内积累了历史数据,因此历史上的每个呼叫都会带有标签。每个呼叫都会有一系列时间拨号,我们可以使用此标签来预测此呼叫是否是高风险呼叫,以及将来是否有投诉。

右边的表是我们进行的统计数据。实际上,我们理性地思考。用户说“不需要”或说“您称我过多的次”的次数越多,该用户的高风险率就越多,将来会投诉。因此,我们构建了这样的模型来预测高风险呼叫。我们预测的结果也将相应处理,例如输入无声数据库并在一定时间内保护电话。该机制的功能是有效减少高风险呼叫的拨号,减少客户骚扰,减少投诉并提高客户服务质量。

第三个业务案例是客户服务质量检查。客户服务方案主要分为两个部分:一个是通话过程中不得出现客户服务。例如,您不能在与客户的电话期间推翻责任,也不能没有开幕词或告别词。另一种情况是,与客户交谈时,我们必须包括某些标签。例如,对于新注册的用户,客户服务必须对他们进行“确认负责人”和“验证包装”等。 ,我们将进行相应的管理。

AI实验室招聘信息


# 58同城智能语音质检系统:语音识别与NLP技术提升销售客服质量  # 58同城智能语音质检系统  # 语音识别与NLP技术提升销售客服质量  # 这是  # 客户服务  # 语音识别  # 高风险  # 第二个  # 过程中  # 如果您  # 自己的  # 检查结果  # 将其  # 呼叫中心  # 是在  # 服务质量  # 转录  # 进行了  # 我们可以  # 认识到  # 的是  # 在一  # 句话  # 丹东网站推广威馨hfqjwl下拉  # 银川网站优化软件  # 农产品网站营销推广  # 公司注册SEO  # seo公司首推  # 中国黑客推广网站是什么  # 推广木业的网站  # 越南推广报刊有哪些网站  # 电子网站建设示例  # 微博营销推广和内容推荐  # 网站内容怎样优化  # 海宁|直播|网站建设项目  # 新手如何自学seo引流  # 网站需优化需要软件  # 抖音有哪些营销推广的功能  # 网页设计及网站建设  # 天津百度网站关键词排名  # 网站推广属于广告费  # 共享打印机的营销与推广  # 吴忠seo或推广 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 网络优化76771 】 【 技术知识130152 】 【 IDC云计算60162 】 【 营销推广131313 】 【 AI优化88182 】 【 百度推广37138 】 【 网站推荐60173 】 【 精选阅读31334


相关推荐: 目前主流的app推广方法中,app推广费用大致需要多少?  是什么?赚钱的思路又是什么?  SEO本站:提升网站流量与排名的秘密武器,店铺如何做营销推广工作  为什么“未备案域名”会成为互联网行业中的重要问题?,推广营销策划口碑  怎样做才能够有效的增加网站流量?  优化网站的秘诀:提高网站速度与用户体验,助力业务腾飞,seo韩语中文是什么  9个简单有效的微信引流方法,天天涨粉1000+你也可以!  SEO未来:如何在变革中抢占先机,迎接数字营销的新纪元,云浮关键词排名多少钱  抖音上面的广告推广价格大约是多少?  写作AI:释放创意,助力高效写作的未来工具,网站推广获取用户  新手做自媒体运营的5大实用技巧和7个必备工具!  使用Emlog搭建个人博客网站的终极指南,珠海专业的网站优化报价  关键词突破:如何在信息洪流中脱颖而出,流量密码,黄平营销推广  SEO合作:让你的网站在搜索引擎中脱颖而出,小说营销推广文案  资深站长总结的快速提升网站排名的5个小技巧分享  目前APP引流最常见的四大推广方式就是他们了!  揭秘广告联盟平台上常见的几种作弊方式!  app推广拉新之app成功与否关键在于这3个运营策略!  如何做音频引流日吸粉100+?做好这四步吸粉非常简单!  前置摸排:企业风险管控的新利器,鄂州网站建设策划公司  新手如何引流男性?推荐这几个渠道和方法!  小红书推广引流没效果?注意这几个小红书引流推广的关键思路!  SEO发明:引领数字时代营销革命的力量,美食网站bbs推广  做网赚想要月入过万所必须要经历的四个阶段!  写小AI:开启你的智能写作新时代,青岛网站建设实例  广告联盟上推广哪类产品最赚钱?  SEO要点:提升网站排名的核心技巧与策略,十堰网络营销推广软件  网站推广该怎么做?适合网站运营新手的10种网站推广方法!  谈谈那些装机广告联盟日赚200的骗局,小心别上当受骗!  微信*号引流的五大方法,学会了每日引流100+轻轻松松!  乘风SEO:突破困境,领航网络营销新时代,谷歌seo推广有效果吗  SEO如何通过正确的SEO策略引爆你的流量与排名,脉脉营销推广方案  网站运营该如何持续地提升网站权重来获取更多的流量?  如何通过美柚引流?在美柚上面引流的方法和技巧分享!  做国外广告联盟赚钱需要准备什么软件和注意哪些细节?  关键词截流:数字营销中的制胜利器,抖音推广怎么做热门网站  刷关键词,提升网站流量与排名的秘密武器,营销礼物推广方案  如何做好微信营销?只需要做好这几步就可以了!  微信公众号引流该怎么做?做好这5点吸粉不是问题!  最新的四种0成本0投入的网络兼职赚钱项目,快来看看!  关键词拓展:精准营销的制胜法宝,承接政府网站建设  微信赚钱项目之如何利用微信解封赚钱?  免费收录:助你网站腾飞的绝佳机会,汾阳灯箱网站建设  刷快排,让你的算法人生更加高效与精彩,seo淘宝客怎么用  “多网建站”助力企业跨越发展,开启全新数字化时代,常州产品seo优化  手机赚钱软件有哪些?想通过手机赚钱这10款软件千万不容错过!  引流技巧中的截流玩法具体如何操作?  社交app如何利用社交新媒体快速进行app推广引流?  推广赚钱平台有哪些?推荐这5个!  个人站长通过网站营销快速获取大量流量的10个方法! 

 2026-01-15

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

致胜网络推广营销网


致胜网络推广营销网

致胜网络推广营销网专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。

 915688610

 17370845950

 915688610@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.