语音识别_厦门书生_书生七剑

语音识别

非特定人的连续人声语音识别系统实现最大的难点已不在于机器学习算法上，而在于大量的机器学习所需要的训练数据，所以在语音识别技术上，除了科大讯飞，只有象百度、腾讯、阿里这样掌握了大量用户语音数据的企业能够实现通用的非特定人连续语音识别引擎。虽然近十年语音识别技术飞速发展，但是在各领域的工程应用上仍然有很多问题，书生在实现慧销售语音机器人的过程中就整合了包括科大讯飞、百度和阿里等多家的语音识别接口，可以随时切换和优选所用识别引擎。除此之外为降低识别接口的调用成本，慧销售机器人也集成了简单的本地语音识别，可以识别包括“欠费、停机”等特定的语音提示。在电话语音识别上，由于线路语音质量相比手机上的高灵敏度麦克风所采集的语音质量要差很多，所以现有的语音识别技术应用到通话内容识别上都有下降，因此书生慧销售机器上还在识别结果之后应用了多种纠错技术，包括更准确的识别肯定否定语气的情感分析技术，基于关键词与语义匹配的意图识别技术等人工智能辅助技术。