编辑导读:AI改变了我们与机器互动的方式,影响了我们的生活,重新定义了我们与机器的关系。本文作者对人机交互的过程进行了分析拆解,对语音识别技术为什么能把语音信号变成文字展开了详细的说明,一起来看看~
背景:市面上有哪些搭载类似交互系统的产品?
微信的小微平台、淘宝的淘小蜜、钉钉的智能工作助理、百度的小度等等,既有面向C端消费者,又有面向B端企业主,如果要论商业化的潜力无疑目前机器人行业很大程度上C端的机器人产品已经几乎被验证无法实现盈利了,参考微软小冰和siri,不过未来教育行业的幼儿机器人也许是一条光明大道。
更多的厂商已经转向了帮助企业主实现数字化管理、智能化办公而开发机器人能力,演化除了机器人的自定义平台,用于企业运维和管理。
智能语音交互系统简单来讲:就是语音识别+语义理解+TTS
虽然说的简单,但是内部系统往往都比较复杂,每个点拆开来可能就足够我们去研究迭代一生。为何说AI时代的重点和基础是语音智能交互?在人工智能时代,人们发现语音比文字输入更能收集到有用的大量信息,这也是一种未来的主流形式。
语音交互流程
智能语音交互系统概括起来就是一段音频被机器人所吸收检测,将识别到到的语音信号截取、转换成语料库里读音信号频率最为相近的文字(所以也有人形容语音识别其实是一种概率事件),而文本会通过特定接口进入语义分析引擎,进行分析。其中就可能要进行分词、命名实体识别、词性标注、依存句法分析、词向量表示与语义相似度计算等NLP基础功能。
NLP基础技术