“吉六顺”承接各种高难优化名词、关键字,拯救各种死站、烂站。可接同行转包-欢迎咨询:点击咨询 移动版 | 加入收藏 | 网站地图
吉六顺:主页 > IT与行业 >

《碟中谍5》背后的生物识别技术谈语音识别

时间:2015-10-08 16:21 来源:哈尔滨sem 作者:吉六顺 点击:

2015 10-04 《碟中谍5》背后的生物识别技术谈语音识别 Wings 计算机技术 最近热映的《碟中谍5》其中出现了不少炫酷的科技,有步态识别技术、水冷数据中心和氧气服、纸书秒变显示屏、

2015
10-04

《碟中谍5》背后的生物识别技术谈语音识别 Wings 计算机技术


最近热映的《碟中谍5》其中出现了不少炫酷的科技,有步态识别技术、水冷数据中心和氧气服、纸书秒变显示屏、3D打印面具、玻璃指纹识别等等,当然其中也有语音识别,今天就从《碟中谍5》中的语音识别讲语音识别技术。

电影中,伊森.亨特重复播放由若干单词组成的一小段英国首相的录音,就轻松骗过了语音识别系统。看似轻松的破解过程,只需要一台录音机就能完成的攻击手段,让“语音识别技术”在黑科技云集的科幻大片中并不那么耀眼。

日常生活中,我们也有接触到各种形式的语音识别技术,用来取代键盘输入,或者变身成Siri一般的智能小助手,与人类进行简单的对话。

语音识别技术,到底在研究什么?能多大程度改变我们的生活?我为各位一一道来。


(“碟中谍5”中的语音识别系统)

语音识别的特点

语音识别,是一种结合了生理和行为两种成分的生物认证技术。气管、鼻腔、咽喉、舌头等组织的相互配合,影响了声音的音调、音强和音色,从而形成了每个人声音的独特性,这构成语音的生理基础;而每个人不同的说话内容,则构成了语音的行为基础。

因此,语音识别是一种很有趣的过程,既要知道你在说什么内容(行为特征),又要知道你在以什么样的方式说(生理特征)。

语音识别,是成本最低的生物识别技术。

因为不需要依赖昂贵的成像芯片和光学镜头,也没有台式PC和移动终端的限制,只需要一枚麦克风即可采集语音,因此在各种身份认证产品中都可以集成该功能。用户对着麦克风说出特定的短语,系统将用户的语音样本过滤后,与先前存储的语音样本比较,达到一定的近似度阈值,用户就通过了身份认证。

语音识别的应用

语音识别技术,分为“语义识别”和“语音身份识别”两大类应用模式。

语义识别,也被称作话语识别、非特定人语音识别,其目的在于理解话语中的单词和句子——也就是话语中的内容。

由于几乎可以被任何人使用,语义识别技术的应用场景非常多样化,被集成到各种设备上,已经成为智能硬件发展的主流趋势。

手机的进化历史,就是文本输入技术的发展史,也是语义识别技术的革命史。最早的功能手机屏幕很小,带有26键或9键实体键盘;随着智能手机发展,实体按键越来越少,甚至整合进入屏幕成为虚拟键盘。实体键消失的大趋势,让文本输入技术发生着改变,而手环、手表、眼镜等小屏或无屏可穿戴式设备的兴起,人们不得不寻找比键盘更有效的文本输入方式。于是,语音识别技术,成为文本输入的最轻松、最自然方式。 

正如Siri为我们展示的那样,我们已经习惯于通过语音拨打电话、打开应用、查询天气,也能不动一根手指,用语音输入法发送消息,但这些语义应用,依然借助了屏幕这一载体。未来,智能设备几乎是没有屏幕可以触摸,最终只能通过语音这种采集成本低、容易集成的方式来实现人机交互。


(苹果的Siri是语义识别技术的应用典范)

语音身份识别,也称说话者识别,将语音作为一种稳定的生物特征来识别说话者的身份。

早期的身份识别精度很低,缺乏特定的语音处理和特征提取技术,只能判断一个人的种族。二战时,美日双方经常夜战,黑暗中无法判断对方是敌是友。美国人根据“日本人对l,r发音不准确”这一声音特性,制定了一个口令“lollapalooza(意为:非常出色的人)”,一旦对方发音不准确,就直接开火。

今天的语音识别精度,已经可以判断一个人的身份。用户对着麦克风说出特定的短语,系统将用户的语音样本进行背景噪音过滤、特征提取,再与先前存储的语音样本比较,达到一定的近似度阈值,用户就通过了身份认证。


(语音身份识别的流程)

语音识别的缺陷

语音的采集成本虽然低,但在身份识别中并未大规模应用。目前看来,主要是因为语音识别面临着不易提取、不够稳定、容易模仿三大问题。

缺乏多样性和噪音影响,是语音特征不易提取的两大原因。

语音是一维线性特征,与指纹、人脸、虹膜等二维图像特征相比,信息量更少,精度也更低。此外,语音识别的性能,还会受到外界环境的影响,如同时有多个说话者,或者环境噪音嘈杂,也会导致语音识别精度降低。

语音会受时间、年龄、身体状况影响而发生改变,是导致语音特征不稳定的重要原因。

每个人在青春期都会经历“变声”的过程,常见的感冒、鼻塞、咽喉炎、声带疲劳都会影响语音识别的性能。因此,语音识别的稳定性并不好。

(责任编辑:吉六顺)
浏览上一篇:很多seoer都在质疑seo行业是行业真的没落了吗?
阅读下一篇:Linux现僵尸网络,攻击目标90%位于亚洲
关于网站 | 新闻订阅 | 网站地图 | 合作伙伴 | 联系我们
Copyright © 2012-2017 吉六顺 版权所有 由“黄牛传媒”提供技术支持 TEL:13359715033
黑ICP备11003048号