人工智能核心技术

发布时间：2016-10-04 作者：e-works 吴星星来源：e-works

关键字：人工智能机器视觉

收藏好文推荐打印

人工智能发展至今涉及多个研究领域，研究方向包括智能控制、符号计算、自然语言理解、模式识别和计算机视觉、机器学习与数据挖掘、智能信息检索、语音识别等。小编经过认真查阅资料，搜集到了人工智能涉及的五项核心技术：计算机视觉、机器学习、自然语言处理、机器人技术和语音识别技术，与大家一同分享。

5 语音识别技术

语音识别技术，也被称为自动语音识别（Automatic Speech Recognition，简称ASR），其目标是将人类的语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同，后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合，可以构建出更加复杂的应用，例如语音到语音的翻译。语音识别技术所涉及的领域包括：信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。

图5 语音识别过程

计算机语音识别过程与人对语音识别处理过程基本上是一致的。目前主流的语音识别技术是基于统计模式识别的基本理论。一个完整的语音识别系统可大致分为三部分：

1）语音特征提取：其目的是从语音波形中提取出随时间变化的语音特征序列。

2）声学模型与模式匹配（识别算法）：声学模型通常将获取的语音特征通过学习算法产生。在识别时将输入的语音特征同声学模型（模式）进行匹配与比较，得到最佳的识别结果。

3）语言模型与语言处理：语言模型包括由识别语音命令构成的语法网络或由统计方法构成的语言模型，语言处理可以进行语法、语义分析。对小词表语音识别系统，往往不需要语言处理部分。

语音识别技术有着非常广泛的应用领域和市场前景。在语音输入控制系统中，它使得人们可以甩掉键盘，通过识别语音中的要求、请求、命令或询问来作出正确的响应，这样既可以克服人工键盘输入速度慢，极易出差错的缺点，又有利于缩短系统的反应时间，使人机交流变得简便易行，比如用于声控语音拨号系统、声控智能玩具、智能家电等领域。在智能对话查询系统中，人们通过语音命令，可以方便地从远端的数据库系统中查询与提取有关信息，享受自然、友好的数据库检索服务，例如信息网络查询、医疗服务、银行服务等。语音识别技术还可以应用于自动口语翻译，即通过将口语识别技术、机器翻译技术、语音合成技术等相结合，可将一种语言的语音输入翻译为另一种语言的语音输出，实现跨语言交流。

共5页

上一页 1 2 3 4 5

本文为e-works原创投稿文章，未经e-works书面许可，任何人不得复制、转载、摘编等任何方式进行使用。如已是e-works授权合作伙伴，应在授权范围内使用。e-works内容合作伙伴申请热线：editor@e-works.net.cn tel：027-87592219/20/21。

上一篇文章：汽车产业变革下工业软件新的核心价值点
下一篇文章：世界需要“中国智能制造”