小爱同学【原理解析】,智能音箱的交互和语音服务你了解吗
目前小米小爱同学的应用有智能音箱、小米电视、手机、小白摄像头、Yeelight等,
小爱智能音箱
那么当我们用问小爱同学天气的时候,或者让小爱同学播放刘德华的歌的时候,智能音箱的交互原理是怎么样的呢? 本文为你分析一下。
麦克风阵列
麦克风阵列作为智能语音交互设备硬件第一关,麦克风阵列直接决定的产品的功能和性能 。
目前麦克风阵列方案有单麦方案,两麦线性阵列,四麦线性阵列,四麦环形阵列和六麦环形阵列 ,下图列出各方案的对比:
麦克风方案对比
单麦方案 一般应用于对交互要求不高的智能硬件,如语音遥控器,智能灯泡等,这种设备多是内置语音控制指令,由特定的指令词去控制。单麦的方案商有启英泰伦等。
启英泰伦的单麦方案
两麦和四麦方案 常见应用于智能音箱,智能机器人等,阿里的天猫方糖用的是两麦方案,小爱音箱mini,小度智能音箱用的是四麦方案。
两麦和四麦方案可以进行语义解析,动态噪声抑制比较高,相对于单麦方案,可利用多麦进行声源定位,环形麦克风阵列比线性的声源定位角度广,两麦和四麦方案商有科大讯飞、声智科技和XMOS等。
环形六麦方案
六麦方案 也广泛用于智能音箱,相对于四麦,六麦声源定位更准确,市场上的小米小爱音箱HD,天猫精灵,叮咚智能音箱都是采用六麦的方案,六麦方案商有科大讯飞、思必驰和XMOS等。
语音技能流程
语音技能流程框图
举个例子,当我们用语音对小爱音箱mini呼唤“小爱同学”让它播刘德华的歌时,小爱音箱mini麦克风接收语音后,内部转化为文字后到小爱云上检索并解析,通过理解语料,调用第三方的语音服务 ,如QQ音乐提供的语音技能服务,然后将QQ音乐上刘德华的歌传输到小爱云,经过整合后通过小爱音箱mini播放出来。
那什么时候用到内置语音服务 呢?当我们命令音箱增加或减少音量,设定闹钟,换歌曲时,就需要调用内置的语音服务,内置的语音服务可以由设备提供。
上面的语音技能流程是众多智能语音音箱的通用流程,阿里的天猫精灵,百度的小度音箱也是同样的原理。
开发小爱语音服务流程
开发小爱语音服务框图
小爱开放平台 提供小爱语音服务的接入,目前支持的具有语音交互能力的智能设备有小米音箱,电视、故事机等。小爱同学语音服务目前在手机、电视、音箱、穿戴、智能家居车载设备等各类智能硬件设备及应用程序都有成熟的应用方案了。
小爱开放平台
在小爱开放平台上开发技能或服务时,小爱同学语音服务接入方式有两种,分别是智能设备接入和应用程序接入。应用场景是根据已有成熟方案确定的,小爱平台为创作者提供NLU能力,设备厂商可以定制设备技能。技能确定后,小米的声学实验室 将会帮开发者选的测试项进行声学测试。
声学分析
小米声学实验室为开发者提供声学设计建议和声学测试与评估,辅助开发者的算法方案选型与开发。开发好的小爱技能自测后需要经过认证,对语音唤醒、语音识别、语义分析等众多语音技能服务进行功能评测和认证。
语音认证则尽可能覆盖各种声学场景,模拟用户真实的实用环境,保证硬件设备语音交互的整体质量。“小爱同学”的品牌可提高设备认可度。
所有的认证完成后,小爱技能才可以正式发布。至此,就可以通过呼唤小爱同学,实现小爱技能了。
四张动图带你看懂音箱的工作原理
四张动图带你走进音箱内部,了解它的工作原理。美中不足在于图全是英文的,万幸之处在于只要了解大概过程是电→磁→活塞运动→耳膜感受,也就能看懂个八九不离十了。
看原因在这里 音箱到底怎么发声的
要知道音箱发声的原理,我们首先需要了解声音的传播途径。声音的传播需要介质(真空不能传声);声间要靠一切气体,液体、固体作媒介传播出去,这些作为传播媒介的物质称为介质。
就好比水波,你往平静的水面上抛一个石子,水面就有波浪,再由对岸传播到4周;声波也是这样形成的。声波的频率在20——20,000Hz范围内,能够被人耳听到;低于或高于这个范围,人耳都听不到。
水波与声波的传播方式是一样的,通过介质的传播,人耳才能听到声音
声波可以在气体、固体、液体中传播
下面在来说说喇叭的工作原理。喇叭是把电信号转换为声信号的一种装置,它由线圈、磁铁、纸盆等组成。由放大器输出大小不等的电流(交流电)通过线圈在磁场的作用下使线圈移动,线圈连接在纸盆上带动纸盆震动,再由纸盆的震动推动空气,从而发出声音。
喇叭的结构
喇叭的发声原理
当喇叭接收到由音源设备输出的电信号时,电流会通过喇叭上的线圈,并产生磁场反应。而通过线圈的电流是交变电流,它的正负极是不断变化的;正极和负极相遇会相互吸引,线圈受到喇叭上磁铁的吸引向后(箱体内)运动;正极和正极相遇则相互排斥,线圈向外(箱体外)运动。这一收一扩的节奏会产生声波和气流,并发出声音,它和我们讲话的喉咙振动是同样的效果。
频率响应曲线SPL vs Freq
人耳所能听到的频率范围为20Hz─20KHz,( 20KHz称为超声 )图标纵坐标─表示声压级,单位是dB。图标横坐标─表示频率,单位是Hz。
图标左侧为低音单体频响曲线,右侧为高音单体,包含左右的是音箱。从频响曲线可以知道几个重要参数:
特性灵敏度(SPL):以一瓦电功率,在一米距离处所测得的声压,并由频响曲线取四个点所得平均值即为平均音压。
有效频率范围(F0~20KHz):可由SPL-10 dB,这样一条直线与曲线相交两点,这两点之间就是有效频率范围。如上图音箱的有效频率范围是45Hz─20KHz,低音单体有效频率范围是40Hz─3KHz,高音单体有效频率范围则是1800Hz─20KHz。频响曲线越平直越好,带宽则越宽越好。
从阻抗曲线可以知道几个重要参数:
阻抗值(Ohm):
图示波峰过后最低点对应纵坐标即为阻抗值。
最低共振周波数(F0):
单体喇叭(单峰)─以阻抗曲线波峰对应横坐标的点即为F0。音箱喇叭(双峰)─以阻抗曲线第一波峰与第二波峰间的波谷对应横坐标的点即为Fb,第一波峰为导音管F0,第二波峰则为单体F0。音箱喇叭+高音单体(三峰)─仍以阻抗曲线波峰与波峰间的波谷对应横坐标的点即为Fb,第三波峰即为高音单体的F0。
1、直流阻抗(Ohm):
以静态扬声器来测其阻抗,所以求的的结果是直流阻抗,就是音圈上所绕的铜线总长的阻抗值。直流阻抗不受频率的影响。
2、交流阻抗(Ohm):
在动态的扬声器,即通电以后所求得的交流阻抗值。( 通常对音圈的公差要求是±15%。)
3、标准输入功率(W):就是扬声器的额定承受功率,为保证值。
4、最大输入功率(W):指扬声器的最大承受功率,仅承受1秒内峰值电压,非保证值。
5、出力音压,又称灵敏度(dB):
灵敏度也叫特性灵敏度,一般规定为扬声器放在消声室隔板上输入端加上相当于在额定阻抗上一瓦电功率的信号电压时,在参考轴上离参考点一米处产生的音压时,用分贝“(dB)”单位表示特性灵敏度。扬声器灵敏度高低与扬声器振动系统的性能及气隙中磁感应强度的大小有较大关系。
6、极性:
在扬声器的输入端加上脉冲直流信号,如果振摸向前推动,则与直流电压正端相接的为喇叭的正极,反之为负极,如果接反,则喇叭振动的相位将不正确。
相关问答
小爱智能音箱的工作原理是什么?-ZOL问答
智能音箱小爱讨论回答(10)智能音响作为一款智能化产品,其实现的核心技术是智能化语音交互系统软件。该软件通过远场鉴别、唤醒词唤起、语音识别技术和词义了...
无线音响原理是什么?
无线音箱有发射端和接收端就跟对讲机差不多只不过一个发射时候无声音用的无线技术分多大功率的能发射多远和穿几米墙无线音箱是没有线路用的是电池...
音响的原理就是通过电流控制磁力,从而震动薄膜发出声音,有...
音响的原理就是通过电流控制磁力,从而震动薄膜发出声音,有一个问题想了很久都不明白.比如说我敲一下一块铁片,同一时刻只发出一种声音,同样是震动一个膜,但音响...
音箱制作成的原理?
音箱的基本原理是将电信号转换成声音。音箱内部通常包含一个磁铁和一个振动线圈,当电流通过振动线圈时,它会在磁场中产生磁场,从而使线圈产生震动。这种震动随...
小度音箱控制家电原理?
小度音箱1S不只是智能音箱,更是一个万能遥控器。其原理是把整个万能遥控器的能力集成在智能音箱之上。“家里所有的遥控器的设备都是红外的,基本上98%以上都是...
磁流体音箱原理?
电动式纸盘扬声器的电声转换效率很低,一般不超过20%,也就是说,它所承受的电功率绝大部分变成了热能.音圈的温升会使音圈的阻抗增大,使其与整机失配.因此要...
音响的工作原理?
[最佳回答]介质混合音响主要是结合了振动音响的振动发声技术原理和普通音响纸质鼓膜喇叭发声原理,将二者融合;其实介质共振混合音响还是很好理解的,介质共振...
骨传导音箱结构原理?
骨传导音箱结构的原理是利用人体的骨骼来传播声音,而不是传统的空气音箱。它的结构由一个小的软硅胶音箱室和一个贴在脖子上的薄膜电容麦克风组成。当设备处...
音响原理是什么?
音响原理是通过将电信号转换成机械振动,再将振动转换成空气压力波动,最终产生声音。首先,电信号经过放大器放大。随后,信号通过扬声器中的振膜产生机械振动,...
音响声音大小原理?
声音大小是由声波的振幅决定的,振幅越大,声音就越响。这是因为声波的振幅决定了空气分子的位移大小,从而影响到达耳膜时的声压大小。除了振幅,频率和声源距离...