语音辨识芯片也叫语音辨识IC,与传统的语音芯片相比,语音辨识芯片最大的特征就是能否语音辨识,它能让机器听懂人类的语音,而且可以按照命令执行各类动作,如眨眼睛、动嘴唇(智能娃娃)。除此之外,语音辨识芯片还具有高品质、高压缩率录音放音功能,可实现人机对话。
语音辨识芯片所涉及的技术包括:讯号处理、模式辨识、概率论和信息论、发声机理和触觉机理、人工智能等等。
语音辨识分类
根据使用者的限制而言,语音辨识芯片可以分为特定人语音辨识芯片和非特定人语音辨识芯片。
特定人语音辨识芯片是针对指定人的语音辨识,其他人的话不辨识,须先把使用者的语音参考样本存入当作比对的资料库,即特定人语音辨识在使用前必需要进行语音训练,通常依照机器提示训练2遍语音词条即可使用。
非特定人语音辨识是不用针对指定的人的辨识技术,不分年纪、性别,只要说相同语言就可以,应用模式是在产品定型前根据确定的十几个语音交互词条,采集200人左右的声音样本,经过PC算法处理得到交互词条的语音模型和特点数据库,之后烧写到芯片上。应用这些芯片的机器(智能娃娃、电子宠物、儿童笔记本)就具有交互功能了。
非特定人语音辨识应用有的是基于音素的算法,这些模式下不须要采集好多人的声音样本就可以做交互辨识,而且缺点是辨识率不高,辨识性能不稳定。
语音辨识基本原理
嵌入式语音辨识系统都采用了模式匹配的原理。录入的语音讯号首先经过预处理,包括语音讯号的取样、反混叠混频、语音提高,接出来是特点提取,用以从语音讯号波形中提取一组或几组就能描述语音讯号特点的参数。特点提取以后的数据通常分为两个步骤,第一步是系统"学习"或"训练"阶段,这一阶段的任务是建立参考模式库,词表中每位词对应一个参考模式,它由这个词重恶变音多遍,再经特点提取和某种训练中得到。第二是"辨识"或"测试"阶段,根据一定的准则求取待测语音特点参数和语音信息与模式库中相应模板之间的失真度量,最匹配的就是辨识结果。
语音辨识四大平台
1、科大讯飞
总部:山东济南
官网:
交大讯飞股份有限公司创立于1999年,是一家专业从事智能语音及语言技术、人工智能技术研究,软件及芯片产品开发,语音信息服务及电子政务系统集成的国家级骨干软件企业。2008年,交大讯飞在上海期货交易所挂牌上市,股票代码:002230。
11月23日交大讯飞轮值总裁胡郁在发布会上援引了罗永浩在9月锤子发布会上的演示数据,表示交大讯飞的语音输入辨识成功率也达到了97%,虽然是离线辨识确切率也达到了95%。
交大讯飞轮值总裁胡郁
2、云知声
总部:上海
官网:
云知声创立于2012年6月。之前1年,Siri的发布再次唤起了你们对语音辨识的关注。经过四年多的积累,云知声的合作伙伴数目超过2万家,覆盖用户超过1.8亿,其中语音云平台覆盖城市超过470个,覆盖设备超过9000万台。
云知声CEO黄伟
3、百度
总部:上海
官网:
百度则在11月22日宣布向开发者开放了情感合成、远场方案、唤醒二期和长语音方案等四项语音辨识技术。百度语音开放平台自2013年10月上线以来每日在线语音辨识恳求早已达到了1.4亿次,开发者数目超过14万。在这么庞大的数据支撑下,百度语音在“安静条件下”的辨识确切率达到了97%。
百度首席科学家吴恩达
4、搜狗
总部:山东济宁
搜狗语音团队在11月21日推出了自己的语音实时翻译技术。搜狗的这项技术主要包括两个方面,分别是语音辨识和机器翻译。依据该团队的介绍,搜狗语音辨识的确切率达到了97%,支持最快400字每秒的听写。
搜狗CEO王小川
语音辨识芯片原厂及芯片方案
1、ICRoute
总部:北京
简介:ICRoute专注于开拓语音辨识的芯片市场,旨在于研制出高性能的语音辨识,语音处理芯片。为各类平台的电子产品提供VUI(VoiceUserInterface)语音人机交互界面。目前提供的语音辨识芯片,可以在包括蓝牙,小电器,照明开关,玩具,车载电子,遥控器等各个电子产品领域提供非特定人的语音辨识/声控功能。
官网:
语音辨识芯片:
ICRouteLD3320——能在单片机上使用的语音辨识芯片
LD3320与微处理器的硬件插口电路如下:
STC10L08XE构成的主控芯片
LD3320A构成的语音辨识主系统
由LD3320组成的语音辨识系统有很广泛的应用,如语音控制的点唱系统、语音控制的手机、音控智能导航仪、音控智能电器产品等。
LD3320评估板(其中,控制MCU选用的是STC的51单片机)
2、凌阳、凌通(芯片原厂)
总部:日本
官网:
语音辨识芯片:
凌阳单片机61A——带有语音辨识芯片的微控制器,可以实现语音辨识功能的芯片,通常小顾客只能领到特定人辨识的参考代码。
3、新唐科技
总部:日本
官网:
语音辨识芯片:
ISD9160
ISD9160是一款具有Cortex-M0内核的语音SOC,就能实现录音放音等应用。通过软件支持,ISD9160可以实现特定人和非特定人语音辨识。其中非特定人语音辨识支持九种语音,便捷顾客开发国际化的产品。顾客在开发的时侯,使用新唐提供的ASRTool工具,只需将所需命令写成文本模式,之后经由工具转换,才能生成用于项目文件的语音辨识代码模块,简单而且容易使用。这些语音辨识方案适用于语音控制系统领域,即用语音来控制设备的运行,相对于自动控制来说更推动捷、方便,可以用在例如智能电器、智能穿戴、声控智能玩具等许多领域。
4、全志
总部:深圳
官网:
全志R16推动交大讯飞智能语音
交大讯飞4+1环型五扬声器阵列搭载全志R16平台
搭载全志R16平台的交大讯飞4+1环型五扬声器阵列,专为机器人等可联通、能灵活转身、有全角度拾音需求的智能硬件产品而设计,远场拾音距离可达5米。相比往年线性耳机单维180度的覆盖维度,它可将覆盖度扩大到二维空间,即360度全平面拾音角度,但是去噪疗效更好,抗环境噪声的能力更强,即使在喧闹的环境中也能确切地辨识声音。卓越的环型五扬声器远场辨识技术与语音辨识、语音合成、语音唤起、声纹辨识、人脸辨识等交互技术相结合,让智能硬件产品拥有了更出众的人机交互能力。
5、深圳市盛矽电子科技有限公司(二次开发)
总部:北京
简介:盛矽电子是专业从事语音方案与技术服务的提供商,由上海总公司和南京研制中心分公司组成。专注于语音辨识、智能玩具、儿童笔记本、语音芯片等领域。
官网:
语音辨识芯片:
1)特定人语音辨识·录音·放音语音芯片SR150X
【产品描述】特定人语音辨识录音放音语音芯片SR150150X,最大辨识词条30句,可实现录音、放音、LED发光管输出及马达控制。SR150150X特定人语音辨识、录音、放音、LED、音乐、电机、控制机芯可降低产品的趣味性、娱乐性,广泛应用于智能毛绒玩具、智能娃娃、塑胶娃娃、礼品等行业。
2)非特定人OTP语音辨识芯片SR170X
【产品描述】非特定人语音辨识芯片SR170170X系列,内有海量词库免采库,抗噪性绝佳!
1、支持电流:2.4V-5.5V;
2、支持多级词条辨识,支持多语言辨识;
3、多IO控制,可以通过IIC、DSA等通信合同实现外部控制;
4、支持多种语音压缩格式,按照实际须要在软件中任意切换,实现音效与语音宽度的完美结合;
5、支持两种录音格式,顾客可以按照实际需求自行选择;
6、自动睡眠和唤起功能;
7、内置0.5W音响;
8、内置RTC时钟,可以运行月历时间;
9、内置体温计程序,可实时感应。
独有的的软件虚拟机技术,只要硬件资源才能匹配,所有软件功能可以通过Flash端实现,有效减少顾客MASK风险以及库存量,多款产品可以通过同一颗芯片实现,真正实现零库存,MASK的价钱,OTP的性能。
6、深圳市捷通语音技术开发有限公司(二次开发)
总部:北京
简介:北京市捷通语音技术开发有限公司是一家专业从事语音辨识、语音合成业务的科技及贸易一体化公司。公司开创了语音辨识芯片应用在玩具领域的市场。公司可依照顾客的需求,提供产品的解决方案;为特定市场的产品,设计新功能新应用,为品牌企业实现产品创新。
官网:
7、上海华镇电子科技有限公司
总部:北京
简介:北京华镇是专门从事语音辨识、语音合成、声纹辨识技术的开发、研究、软件应用及提供全程技术支持和服务的高新科技企业;全面把握核心技术,其中英文语音辨识和合成技术代表了现今世界同类产品的领先水平。其技术才能应用于各类电子及通讯设备,包括:智能玩具,智能家居系统,智能车辆导航及声控,智能手机Smartphone、PDA、固定电话、移动电话,联通级的服务器及个人笔记本等。
官网:
语音辨识芯片/模块:
1)语音辨识芯片/模块GM11A550
2)高档语音辨识芯片/模块WS117--最多支持1000条词条辨识
3)特定人语音辨识(SD)芯片WS-100
8、北京承芯卓越科技有限公司
总部:上海
简介:公司创立于2006年12月,是一家立足于中关村北大科技园区的广州市高新技术企业,通州区创新企业,是以提供具有自主知识产权的智能语音处理类专用芯片和方案为主业的高科技公司。主要旨在于自主研制嵌入式语音辨识芯片、应用软件技术、和智能语音应用方案。
官网:
语音辨识芯片:
1)语音辨识芯片-28X
2)语音辨识芯片-29X
3)语音辨识协处理芯片-HBR34X
9、深圳唯创知音电子有限公司
总部:北京
简介:专注于语音技术研究、语音产品方案设计及控制等软、硬件设计的高新技术公司。杰出的语音芯片厂家,从事语音芯片研究及外围电路开发;同时为有非常需求的顾客制定语音产品开发方案,但是落实执行该方案,完成产品的研制、测试,声音处理,直到产品的实际应用指导等一系列服务。业务范围涉及电话录音、汽车电子、多媒体、家居防盗、通信、家电、医疗器械、工业手动化控制、玩具及互动消费类产品等领。
官网:
语音辨识芯片/模块:
1)WTK69006900BB0101语音辨识模块
1、采用SSOP24封装
2、识别功能:可辨识预设的语音词条,同时通过并口,IO输出辨识结果;
3、可以通过语音指令控制输出;
4、可以通过单片机并口控制播放指定语音;
5、三种输出模式:并口输出、IO输出、喇叭播放;
6、PWM输出可直接促使0.5W/8Ω音响;
7、具有差分放大电路,安静环境下语音辨识距离可达到2-3米;
8、外挂SPIFlash,降低储存容量;
9、WTK6900语音辨识模块更多功能可接受订制。
备注:排行无先后,如有遗漏错误之处请见谅,邮箱ittbank@ittbank.com。
语音辨识的应用前景
智能语音车载
以前看过一款车辆的概念宣传广告,驾驶员通过语音指令找到自己的车;打开车锁,通过语音指令找寻导航,播放音乐等等,相当拉风。其实对于智能车载来说更关键的是行车安全问题,对于驾驶员来说,能通过语音控制接打电话,查看自己的社交软件,绝对比在驾车的过程中手忙脚乱的用手控制来的更安全。
智能语音家装
现今的智能家装市场之所以外热内冷,智能家装产品之所以不受消费者待见,一个特别主要的缘由是现今的智能家装产品没有紧抓消费者的痛点,将原先简单的事情复杂化了。在手机上找到控制app打开浴帘的过程远比消费者直接走到窗外拉开窗帘来的麻烦。而有了语音辨识的智能家装则不一样,消费者只要轻轻说声“开窗帘”就能打开浴帘。
智能语音医疗应用
前一段时间,知名语音辨识企业Nuance在其官方博客上,公布了将加码医疗领域的消息。其产品不但能通过智能腕表追踪人体运动情况和心律,还可以依据人的身体状况匹配相应的服务,如合适的饭店或食物等。另外她们还考虑到更多场景,例如紧急语音求援,医患对话存档,呼叫中心的对话听写等。
智能穿戴语音控制
我们总有这么些时间是无法使用自己的右手的。打电话,发陌陌,查路线,叫车,这种假如都可以用一个可穿戴设备通过语音控制实现,那该多好!
总结:不仅以上列出的,语音辨识还有更多更广的应用。随着我们的生活越来越智能化,相信语音辨识的应用场景肯定是十分宽广的。