语音、指纹和手势识别:人机交互大战在即

当下的人机交互定义是,人要多方便,机器就要多勤快!人怕偷,机器就要防贼!乍一看不明白,自己一想不难。人动嘴比动手容易,动手比划几下比写字容易,手指摸一摸比记密码容易。小结一下就是人机交互的市场刚需,语音、指纹和手势识别将主宰人机交互市场需求。

人机交互的传统定义是,人输入信息给设备,设备给出反馈的形式。传统的人机交互形式由按键或者触摸屏来控制,信息入口固定,操作形式也比较单一。

学界认为随着科技的进步,人性化和安全性成为人们的关注点,随之出现了除了人的手之外更多与机器互动的新方向。目前人机交互有了多种形式,能用到更多的人身上的信息输送给机器,比如声音、眼睛、嘴唇、大脑等,所以就有了相应的一些人机交互技术,目前的一些交互技术有语音交互、手势识别、指纹识别、虹膜识别、体感识别等。

我爱方案网推荐技术比较成熟的语音、指纹、手势识别人机交互芯片厂商和流行应用方案与需求,从多方面剖析人机交互现状,以供行业设计参考。

Part 1 语音识别

技术提供商:科大讯飞、云之声、思必驰

科大讯飞是08年挂牌上市公司,其语音引擎分为语音合成引擎、语音识别引擎、声纹识别引擎。在2016中国电子信息博览会上,我爱方案网举办的智能硬件开发者创客大会体验了科大讯飞的同传语音到文字的转换系统。文字再造流畅,准确,现场同步显示,对会议资料整理、企业技术宣传和聋哑人参加会员都起到创新示范。体验科大讯飞的语音合成引擎还能够将文字转化为声音通过机器说出来,在机器人领域应用比较广泛;语音识别引擎是让机器能够听懂人说话;声纹识别能够让机器辨别出说话人的身份,安全领域上大有作为。科大讯飞语音技术在教育产品上目前市场份额最大,也是其主营的一个领域,另外手机应用、音乐、行业的应用也是科大讯飞的重点领域。

云之声在语音技术的一个垂直应用,其语音引擎跟针对智能产品的服务为主,主要涉及智能家居、智能车载等领域,在智能家居领域应用广泛。

思必驰也是一个垂直语音应用主要专注在智能车载、智能家居和智能机器人这三大领域,其中智能车载为公司的主营业务,在车载市场上占有的份额比较大。

现在针对语音技术处于细分市场切割状态,每家语音厂商自建系统,每个市场的情景模式都对应着一套语音系统,成本高,不利于规模发展。我爱方案网认为,语音技术应该分为基础技术厂商(如科大讯飞),语音方案公司(行业/产品应用,如无人机语音控制盒子,服务机器人语音识别包),由方案公司推动新语音应用。这是语音市场未来2-3年的发展主旋律。

Part 2 指纹识别

目前的手机是指纹识别第一大市场,下一个市场黑马在哪里。我爱方案网认为门禁,家居门禁和汽车门锁是下下一个大市场。但是,市场的发展要取决于是指纹识别系统性能指标和算法性能,指纹识别技术的主要几个指标:

拒识率(false rejection rate,FRR):是指将相同的指纹误认为是不同的,而加以拒绝的出错概率。

FRR=(拒识的指纹数目/考察的指纹总数目)×100%。

误识率(false accept rate,FAR):是指将不同的指纹误认为是相同的指纹,而加以接收的出错概率。

FAR=(错判的指纹数目/考察的指纹总数目)×100%。

除了以上2个指标,另外用户很关心指纹识别模组的静态电流和识别速度。

从指纹芯片流派上讲,国外指纹识别芯片公司分为“水果派”和“粮食派”。Apple(AuthenTec)是水果派的代表,Fingerprint Cards是非苹果派(粮食派)的代表。本地也有市场占有率不错的指纹识别芯片公司,汇顶科技是一个代表。

Apple(AuthenTec)

AuthenTec 为国际领先的指纹识别技术提供商,被 Apple 收购后现在产品只用于苹果的手机。

Fingerprint Cards

瑞典公司,是目前全球除AuthenTec外,最大的按压式指纹识别传感器供应商(不含算法和算法芯片)。得益于AuthenTec只对苹果提供产品和技术,FPC成了非苹果手机阵营的宠儿。今年国内也有不少手机搭配的是FPC的指纹识别传感器。如:华为荣耀7、中兴ARON、魅族MX5、OPPO R7 Plus、一加OnePlus 2等,目前FPC的势头非常火热,但它的传感器价格也不低。相信随着更多指纹识别供应商的产品通过测试和小批量验证,FPC的价格会回归到正常的范围。

新思Synaptics Validity

Synaptics是全球领先的移动计算、通信和娱乐设备人机界面交互开发解决方案设计制造公司。其成立于1986年,总部在美国。2013年10月17日时,其以2.55亿美元的价格收购了生物ID识别公司Validity,进军指纹识别领域,美国公司,属行业的跨界者,自从2013年10月收购Validity之后开始涉足指纹识别行业。目前量产的指纹识别传感器主要以刮擦式(滑动采集)的为主,体验差于按压式传感器。三星Galaxy、HTC等手机上的刮擦式指纹识别传感器正是由Synaptics提供。

国内指纹识别芯片公司:

汇顶科技、思立微、迈瑞微、神盾、敦泰、比亚迪等。

汇顶科技有其代表性:

汇顶科技的GF32系列在6月份赢得vivo X7的指纹识别业务。该方案采用了120μm的陶瓷盖板,是目前量产的陶瓷盖板中厚度最高的,这不仅大大提高了指纹识别的抗压及抗冲击能力,同时也保障了指纹识别的可靠性;其次,该方案的芯片算法得到优化,使用户在湿手状态下获得最佳体验;而其所拥有的更高的指纹识别精准度,在保障用户体验的同时,也保障了用户的移动支付安全;此外,该陶瓷盖板指纹识别方案支持150ms的解锁速度,成为vivo X7能够实现急速解锁的秘密武器。 GF32xx指纹解决方案完全符合FIDO通用验证框架(UAF),而汇顶科技始终处于帮助移动用户抵御技术风险的前沿,在保障便捷性的同时确保用户利益的最大化。

在汽车应用方面,我爱方案网跟踪深圳名帅。从“2016智能硬件开发者创客大会”到“2015创业之星全球创客大赛”这些我爱方案网举办的极具影响力活动中,深圳名帅都积极参与者并获取了非常好的市场需求对接。

Part 3 手势识别

手势识别的核心技术再与传感器和算法,光感传感器和红外传感器是手势识别信号采集的两大主流技术。在智能手机和汽车领域,手势识别传感器快速增长,手势识别通过判断人是的运动轨迹做出相应的反馈,手势识别技术的难点主要在手势算法的多样性和误识别率。手势识别算法的多样性决定了人们可以操作的多样性,有的传感器能判断人的手上下左右移动,这是相对简单的算法;复杂一点的加上了几个特定的动作,比如画圈圈、特定的组合动作等等。

目前手势识别传感器的厂商有很多,基于光学传感器来实现,各家的传感器技术在环境光的影响下手势识别的准确度也是有高有低。

ADI:ADI 最近推出的ADUX1020 光学传感器,在宝马车上已经使用,除了能够上下左右动作识别还加入了其他一些特定的动作,比如手指转圈圈调节音量大小,双指交叉来实现锁屏和开屏动作。

Vishay:Vishay的新款手势控制传感器演示板包含一颗Vishay Semiconductors VCNL4020集成式接近和环境光传感器,两颗安装在传感器两侧的Vishay VSMF2890RGX01红外二极管。使用这些元器件,通过比较来自每个发射器的红外光信号,就可以完成对手势的检测。

夏普:利用红外传感器可以知道手的运动方向,实现一些简单的翻页等操作,目前在行车记录仪和中控车机市场有厂家选用夏普的识别技术嵌入到产品当中。

还有一系列公司在手势识别技术领域耕耘,如中茵股份、华平股份、士兰微、赛为智能等。

Part 4 方案超市人机交互应用方案

语音、指纹、手势识别的上游芯片商基本已经准备就绪,现在市面上又有哪些成熟的应用方案呢?我爱方案网整理了一批淘方案库中可销售方案,集中到方案超市推荐给方案需求方,以下为精选方案。

精选方案1、离线低成本语音指令识别控制器

方案概述

主控选型 :Cortex M3语音SOC

功能

1、具体简单的离线语音识别功能,20条指令,有效识别距离3m;

2、具有8路触控按键输入;

3、支持两路PWM灯控信号(频率>20KHz,级数256)

4、具有语音播报功能,直驱8R 1W喇叭;

5、可以客制添加其他扩展功能;

技术参数: 语音指令有效识别距离3m,识别率高达95%以上;

通讯接口:1、可以支持SOC方案,无需其他接口;2、如果需要配合其他MCU工作,则可以使用I2C接口;

应用场合:设备工作环境相对安静的场合,例如室内声控灯、还有其他传统产品附加语音控制功能,如开关插座、风扇、空调等等;

方案优势:低成本、语音识别率高、识别距离远、另提供客制软件编程,可以替换原来方案之MCU,所以可以给旧产品添加语音识别的同时,基本不需要增加成本。

方案详情:http://kb.52solution.com/index.php?do=caseinfo&id=161

精选方案2、FPM01指纹模组

方案概述

主控选型: 顺元主控

FPM01为电容式半导体面型指纹识别二次开发模块,具有体积小、功耗低、接口简单、可靠性高、指纹模板小(496字节)、大容量指纹识别(3000枚指纹,不分组识别响应时间小于1.5秒)等优点,可以轻松将其嵌入用户系统,组成满足客户需求的指纹识别产品。

FPM01采用进口指纹识别算法,具备:

1 自学习功能:指纹识别过程中,最新提取的指纹特征值识别成功后将该特征值融合到指纹数据库中,使用户在使用过程中越用越好用。

2 360度自动校正识别功能:在模块上任意角度按压 正确注册的手指,比对都可以通过。

FPM01模块通讯接口为USB或UART, 本模块作为从设备,由主设备发送相关命令对其进行控制。

该模块具有可调节的安全等级功能、指纹特征数据的读/写功能和 1:N 识别及 1:1 验证功能等。

应用场合:应用于安防级别较高的领域

方案详情:http://kb.52solution.com/index.php?do=caseinfo&id=157

精选方案3:麦克风阵列

方案概述

方案参数

1)远距离拾音 2个的麦克风阵列 拾音图形 A)心型 B)8字型 C)锥型

拾音图形外的部分最大噪声衰减 < 6—8 dB (空域)

最大噪声衰减: < 20 db/40 db (频域)

要求的输入信噪比 SNR : > 0 db

音频采样率: 8, 16,kHz

输出信号延迟: 15 ms

供电: 3.3V

输入/输出: Line-in/Line-out

2)近距离拾音 2个的麦克风阵列

最大噪声衰减: < 30 db/60 db (频域)

要求的输入信噪比 SNR : > -15 db

音频采样率: 8, 16 kHz

输出信号延迟: 15 ms

供电: 3.3V

输入/输出: Line-in/Line-out

应用场合与方案优势

优势: 在频域降噪的基础上加上空域的降噪(麦克风阵列)将获得更好的效果。如果是近距离拾音,信噪比可工作在负的 15 dB 左右。

应用:安防: 高品质拾音器;医疗保健:降噪数字助听器;人工智能: 远距离拾音;会议系统:麦克风预处理;强噪环境拾音:头戴耳麦 (直升机, 军警, 消防, 矿山,港口,等);

方案详情:http://kb.52solution.com/index.php?do=caseinfo&id=136

如果你也有类似的智能产品方案,可以在淘方案(http://tao.52solution.com/)提交简单的需求描述,我们将对接方案商,让方案推广事半功倍!

小结

物联网的趋势给人机交互带来了新的发展趋势,人对设备的要求提高了,智能设备不仅仅是完成应用场合的既定需求,还需要智能设备有灵活“算法”,做到真正能与人交流的交互。

现在的人机交互限于技术,给人的感觉是“还不够智能”,行动上还依赖人的指导。未来,人与机器之间的交流,将从机械的外在互动上升至情感层面的交流,所有具体的操作性设备将自然而然融进整体的信息基础建设中,取而代之的会是各种各 样、无处不在、形状各异的传感器,以及融合人工智能、大数据的云计算平台,它们将变得越来越聪明,善解人意,实时为人机交互系统提供源源不断的信息。

语音、指纹、手势,这三大人机交互技术中有传统识别技术,也有新锐创意开发,在未来,这其中哪种识别技术可以主导市场,是否还会有黑马出现,还有很多的未知数,可以明确的是智能设备在进步,人机交互的必要性必然导致市场争夺,人机交互的大战号角已经吹响,最终的王者在哪里?我爱方案网和大家一起见证!

人机交互专题(http://www.52solution.com/special-topic/150)

举报
评论 0