专利转让平台_买专利_卖专利_中国高校专利技术交易-买卖发明专利上知查网

全部分类
全部分类
一种高生物拟真性语音处理滤波器与语音识别设备

一种高生物拟真性语音处理滤波器与语音识别设备

IPC分类号 : G10L21/0208,H03H17/02,H03H17/00

申请号
CN201710805731.7
可选规格
  • 专利类型: 发明专利
  • 法律状态: 有权
  • 申请日: 2017-09-08
  • 公开号: 107799122B
  • 公开日: 2018-03-13
  • 主分类号: G10L21/0208
  • 专利权人: 中国科学院深圳先进技术研究院

专利摘要

本发明提供了一种高生物拟真性语音处理滤波器,该滤波器为由带通滤波单元、低通滤波单元及椭圆低通滤波单元依次级联构建的九阶滤波器,其中,该九阶滤波器的中心频率通过低通滤波单元来调整。这样,结合生物耳蜗的频率响应特性,特定中心频率附近的声音响应曲线可以细分为较缓的无源段、有源的具有选择性的阶段以及突然陡变的截止阶段,较缓的无源段采用带通滤波进行处理,有源的具有选择性的阶段采用低通滤波进行处理,突然陡变的截止阶段采用椭圆低通滤波单元进行处理,从而实现具有高生物拟真性、功耗低的语音处理。

权利要求

1.一种高生物拟真性语音处理滤波器,其特征在于,所述滤波器为由带通滤波单元、低通滤波单元及椭圆低通滤波单元依次级联构建的九阶滤波器,所述九阶滤波器的中心频率通过所述低通滤波单元来调整,所述带通滤波单元用于处理较缓的无源段;所述低通滤波单元用于处理有源的具有选择性的阶段;所述椭圆低通滤波单元用于处理突然陡变的截止阶段;其中,所述较缓的无源段、所述有源的具有选择性的阶段以及所述突然陡变的截止阶段是以结合生物耳蜗的频率响应特性,对特定中心频率附近的声音响应曲线进行细分得到的。

2.如权利要求1所述的高生物拟真性语音处理滤波器,其特征在于,所述九阶滤波器采用Gm-C形式,其中Gm为跨导放大器的跨导值,C为电容。

3.如权利要求1所述的高生物拟真性语音处理滤波器,其特征在于,所述带通滤波单元的传递函数表示为:

其中,ω0为所述中心频率,s表示复数域。

4.如权利要求1-3任一所述的高生物拟真性语音处理滤波器,其特征在于,所述带通滤波单元中各个跨导放大器的跨导值Gm=ω0C0,其中,ω0为所述中心频率,C0为基准电容的容量。

5.如权利要求4所述的高生物拟真性语音处理滤波器,其特征在于,所述带通滤波单元包括第一跨导放大器、第二跨导放大器、第三跨导放大器、第一电容和第二电容,其中:

所述第一跨导放大器的正相输入端接入初始输入信号,所述第一跨导放大器的反相输入端接所述第二跨导放大器的反相输入端,所述第一跨导放大器的输出端接所述第二跨导放大器的正相输入端且通过所述第一电容接地,所述第二跨导放大器的反相输入端接其输出端,并通过所述第二电容接地,所述第三跨导放大器的反相输入端接入所述基准电压信号,所述第三跨导放大器的正相输入端接初始输入信号,所述第三跨导放大器的输出端接所述第二跨导放大器的输出端,且所述第二跨导放大器的输出端作为所述带通滤波单元的输出端。

6.如权利要求1所述的高生物拟真性语音处理滤波器,其特征在于,所述低通滤波单元的传递函数表示为:

其中,ω0为所述中心频率,s表示复数域,β为增益变量。

7.如权利要求1、2或6所述的高生物拟真性语音处理滤波器,其特征在于,所述低通滤波单元包括两个串联连接的低通滤波器。

8.如权利要求7所述的高生物拟真性语音处理滤波器,其特征在于,所述低通滤波器包括第四跨导放大器、第五跨导放大器、第三电容和第四电容,其中:

所述第四跨导放大器的正相输入端接输入信号,所述第四跨导放大器的反相输入端接所述第五跨导放大器的反相输入端,所述第四跨导放大器的输出端接所述第五跨导放大器的正相输入端且通过所述第三电容接地,所述第五跨导放大器的输出端并接其反相输入端,且通过所述第四电容接地,所述第五跨导放大器的输出端作为所述低通滤波器的输出端。

9.如权利要求8所述的高生物拟真性语音处理滤波器,其特征在于,所述第四跨导放大器的跨导值所述第五跨导放大器的跨导值Gm5=βω0C0,其中,ω0为所述中心频率,C0为基准电容的容量,β为增益变量。

10.如权利要求1所述的高生物拟真性语音处理滤波器,其特征在于,所述椭圆低通滤波单元的传递函数表示为:

其中,ω0为所述中心频率,s表示复数域。

11.如权利要求10所述的高生物拟真性语音处理滤波器,其特征在于,所述椭圆低通滤波单元包括串联连接的第一椭圆滤波器和第二椭圆滤波器。

12.如权利要求11所述的高生物拟真性语音处理滤波器,其特征在于,所述第一椭圆滤波器包括第六跨导放大器、第七跨导放大器、第五电容、第六电容和第七电容,其中:

所述第六跨导放大器的正相输入端接所述低通滤波单元的输出信号,所述第六跨导放大器的反向输入端接所述第七跨导放大器的反相输入端,所述低通滤波单元中的第五跨导放大器的输出端接所述第七跨导放大器的正相输入端且通过所述第五电容接地,所述第七跨导放大器的输出端并接其反相输入端,且通过所述第六电容接地,所述第六跨导放大器的正相输入端通过所述第七电容接所述第七跨导放大器的输出端,所述第七跨导放大器的输出端接所述第二椭圆滤波器。

13.如权利要求12所述的高生物拟真性语音处理滤波器,其特征在于,所述第二椭圆滤波器包括第八跨导放大器、第九跨导放大器和第八电容,其中:

所述第八跨导放大器的正向输入端接所述第一椭圆滤波器的输出信号,所述第八跨导放大器的反相输入端接基准电压信号,所述第八跨导放大器的输出端接所述第九跨导放大器的反相输入端和输出端,所述第九跨导放大器的正向输入端接所述基准电压信号,所述第九跨导放大器的通过所述第八电容接地,且作为椭圆低通滤波单元的输出端。

14.一种语音识别设备,其特征在于,包括权利要求1至13任一项所述高生物拟真性语音处理滤波器。

说明书

技术领域

本发明涉及语音识别领域,特别是涉及一种高生物拟真性语音处理滤波器与语音识别设备。

背景技术

人对声音感知的关键部位是耳朵的耳蜗,耳蜗对声音的感知不同部位针对不同的频率,从蜗尖到蜗底响应频率分布范围由约20Hz到20KHz。此外,根据已有科学研究表明,生物耳蜗对声音有特定的频率响应曲线,目前的语音处理滤波器基本采用普通的模拟带通滤波器或者数字滤波器,没有考虑生物耳蜗的声音频率响应特性。

人的语音本身是连续时域的,数字滤波的形式首先需要把模拟信号转换成数字信号,根据奈奎斯特采样定律,转换过程很容易出现数字冗余和失真现象,而且数字滤波很难做到低功耗,滤波速度也比较缓慢。采用普通的模拟带通滤波器完全没有考虑生物耳蜗的频率响应特性,会损失很多关键的语音信息,从而会降低人声音的识别效果。

发明内容

本发明的目的在于提供一种高生物拟真性语音处理滤波器与语音识别设备,旨在解决对现有模拟带通滤波器或者数字滤波器对人声音进行语音处理时,存在识别效果差、容易失真的问题。

一方面,本发明提供了一种高生物拟真性语音处理滤波器,所述滤波器为由带通滤波单元、低通滤波单元及椭圆低通滤波单元依次级联构建的九阶滤波器,所述九阶滤波器的中心频率通过所述低通滤波单元来调整。

另一方面,本发明还提供了一种语音识别设备,包括上述高生物拟真性语音处理滤波器。

本发明提供的高生物拟真性语音处理滤波器采用先进的低功耗模拟集成电路技术,结合生物耳蜗的频率响应特性,特定中心频率附近的声音响应曲线可以细分为较缓的无源段、有源的具有选择性的阶段以及突然陡变的截止阶段,在较缓的无源段采用带通滤波进行处理,在有源的具有选择性的阶段则采用低通滤波进行处理,在突然陡变的截止阶段则采用椭圆低通滤波单元进行处理,从而实现具有高生物拟真性、低功耗的语音处理。

附图说明

图1为本发明实施例中高生物拟真性语音处理滤波器的模块示意图;

图2为耳蜗对声音的频率响应曲线;

图3为本发明实施例中跨导放大器的电路原理图;

图4为图1所示开高生物拟真性语音处理滤波器的带通滤波单元电路原理图;

图5为图1所示开高生物拟真性语音处理滤波器的低通滤波单元电路原理图;

图6为图1所示开高生物拟真性语音处理滤波器的椭圆低通滤波单元电路原理图;

图7为图1所示高生物拟真性语音处理滤波器的高频12KHz频率响应仿真曲线;以及

图8为图1所示高生物拟真性语音处理滤波器的低频20Hz频率响应仿真曲线。

具体实施方式

为了使本发明要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

请参阅图1和图2,本发明实施例中的高生物拟真性语音处理滤波器可应用在人工耳蜗、助听器等语音识别设备,该高生物拟真性语音处理滤波器为由带通滤波单元10(BandPass Filter,BPF)、低通滤波单元20(Low Pass Filter,LPF)及椭圆低通滤波单元30(Elliptic Filter,ELF)依次级联构建的九阶滤波器,其中,该九阶滤波器的中心频率可通过低通滤波单元20来调整。如此,针对特定中心频率附近的声音响应曲线可以细分为三个阶段,第一是较缓的无源阶段,此时使用带通滤波单元10进行处理,第二是有源的具有选择性阶段,此时使用低通滤波单元20进行处理,第三是突然陡变的截止阶段,此时使用椭圆低通滤波单元30进行处理。

在本发明实施例中,九阶滤波器采用Gm-C形式,其中Gm为跨导(运算)放大器(OTA)的跨导值,C为电容。Gm-C滤波器路组成单元主要有跨导放大器和电容。

请参阅图3,在本发明实施例中,跨导运算放大器包括第一POMS管M1、第二PMOS管M2、第三PMOS管M3、第四PMOS管M4、第一NMOS管M5、第二NMOS管M6、第三NMOS管M7、第四NMOS管M8。

第一POMS管M1的栅极和第二PMOS管M2的栅极共接电压源VDD,第一POMS管M1的源极和第二PMOS管M2的源极共接可以调整的偏置电流ISS,通过改变偏置电流ISS的大小可以改变相应滤波器的中心频率。第一POMS管M1的漏极接第三PMOS管M3的源极,第二PMOS管M2的漏极接第四PMOS管M4的源极,第三PMOS管M3的栅极作为跨导运算放大器的反相输入端,第三PMOS管M3的漏极接第一NMOS管M5的漏极并作为跨导运算放大器的正相输入端。第一NMOS管M5的源极、第三NMOS管M7的漏极、第三NMOS管M7的栅极及第四NMOS管M8的栅极共接,第三NMOS管M7的源极接地;第二PMOS管M2的漏极接第四PMOS管M4的源极,第四PMOS管M4的栅极作为跨导运算放大器的输出端。第四PMOS管M4的漏极与第二NMOS管M6的漏极、第二NMOS管M6的栅极和第一NMOS管M5的栅极共接。第二NMOS管M6的源极接第四NMOS管M8的漏极,第四NMOS管M8的漏极接地。

在本发明实施例中,带通滤波单元10的传递函数表示为:

低通滤波单元20的传递函数表示为:

椭圆低通滤波单元30的传递函数表示为:

由此可得,九阶滤波器的传递函数为:

其中,ω0为九阶滤波器的中心频率,s表示复数域,β为增益变量。

带通滤波单元10中各个跨导放大器的跨导值Gm=ω0C0,其中,ω0为九阶滤波器的中心频率,C0为基准电容的容量。请参阅图4,带通滤波单元10包括第一跨导放大器Gm1、第二跨导放大器Gm2、第三跨导放大器Gm3、第一电容C1和第二电容C2。

第一跨导放大器Gm1的正相输入端接入初始输入信号Vi,第一跨导放大器Gm1的反相输入端接第二跨导放大器Gm2的反相输入端,第一跨导放大器Gm1的输出端接第二跨导放大器Gm2的正相输入端且通过第一电容C1接地,第二跨导放大器Gm2的反相输入端接其输出端,并通过第二电容C2接地,第三跨导放大器Gm3的反相输入端接入基准电压信号Vref,第三跨导放大器Gm3的正相输入端接初始输入信号Vi,第三跨导放大器Gm3的输出端接第二跨导放大器Gm2的输出端,且第二跨导放大器Gm2的输出端作为带通滤波单元10的输出端输出一次滤波信号V0。在本发明实施例中,第一电容C1和第二电容C2的容量为C0,第一跨导放大器Gm1、第二跨导放大器Gm2和第三跨导放大器Gm3的跨导值Gm1=Gm2=Gm3=ω0C0。

请参阅图5,低通滤波单元20包括两个串联连接的低通滤波器201,低通滤波器201包括第四跨导放大器Gm4、第五跨导放大器Gm5、第三电容C3和第四电容C4。

第四跨导放大器Gm4的正相输入端接输入信号,即前级的低通滤波器201的第四跨导放大器Gm4的正相输入端接入一次滤波信号V0,第四跨导放大器Gm4的反相输入端接第五跨导放大器Gm5的反相输入端,第四跨导放大器Gm4的输出端接第五跨导放大器Gm5的正相输入端且通过第三电容C3接地,第五跨导放大器Gm5的输出端并接其反相输入端,且通过第四电容C4接地,第五跨导放大器Gm5的输出端作为低通滤波器201的输出端,即次级的低通滤波器201的第五跨导放大器Gm5的输出端输出二次滤波信号V1。

在本发明实施例中,第四跨导放大器Gm4的跨导值 第五跨导放大器Gm5的跨导值Gm5=βω0C0,其中,C0为基准电容的容量。β出现在LPF的传输函数中表示增益变量,通过调整β这个参数可以调整滤波器的增益,具体可以调节跨导放大器的偏置电流ISS的大小,如此,以调整九阶滤波器的中心频率。在本发明实施例中,低通滤波器201中的第三电容C3和第四电容C4的容量为0.6667C0

椭圆低通滤波单元30中各个跨导放大器的跨导值Gm=ω0C0。请参阅图6,椭圆低通滤波单元30包括串联连接的第一椭圆滤波器301和第二椭圆滤波器302。

第一椭圆滤波器301包括第六跨导放大器Gm6、第七跨导放大器Gm7、第五电容C5、第六电容C6和第七电容C7。第六跨导放大器Gm6的正相输入端接低通滤波单元20的输出信号(二次滤波信号V1),第六跨导放大器Gm6的反向输入端接第七跨导放大器Gm7的反相输入端,第五跨导放大器Gm5的输出端接第七跨导放大器Gm7的正相输入端且通过第五电容C5接地,第七跨导放大器Gm7的输出端并接其反相输入端,且通过第六电容C6接地,第六跨导放大器Gm6的正相输入端通过第七电容C7接第七跨导放大器Gm7的输出端,第七跨导放大器Gm7的输出端接第二椭圆滤波器302的输入端。在本发明实施例中,第五电容C5、第六电容C6的容量分别为0.3016C0、1.467C0。

第二椭圆滤波器302包括第八跨导放大器Gm8、第九跨导放大器Gn9和第八电容C8。第八跨导放大器Gm8的正向输入端接第一椭圆滤波器301的输出信号,第八跨导放大器Gm8的反相输入端接基准电压信号Vref,第八跨导放大器Gm8的输出端接第九跨导放大器Gn9的反相输入端和输出端,第九跨导放大器Gn9的正向输入端接基准电压信号Vref,第九跨导放大器Gn9的通过第八电容C8接地,且作为椭圆低通滤波单元30的输出端输出三次滤波信号V2。在本实施例中,第八电容C8的容量为1.27C0。

在滤波器Gm-C电路中,信号依次通过BPF、LPF、ELF。在滤波器传输函数中ωB、ωL和ωE分别代表BPF、LPF和ELF的固有频率,QB和QL分别代表BPF和LPF的品质因子,ELF则根据通带纹波为1dB、阻带衰减为40dB的三阶低通椭圆滤波器进行设计。

上述滤波器传输函数相关参数根据最新生理实验数据来设置。在强声音刺激情况下,从生物耳蜗的频率响应曲线可知,QB设为1比较适合,在微弱声音刺激时,根据生物耳蜗频率响应曲线中心频率位置,ωL和ωE设置为1.5ωB,ωB用ω0来表示,其大小可以在20Hz到20KHz之间改变,确定整个滤波器通道的中心频率位置,QL用1/β来表示,其值可以根据不同强度的声音刺激来进行调节,以确定各种声音强度情况下的滤波器品质因子大小。

请参阅图7和图8,其中,本发明实施例的九阶滤波器频率从20Hz到12KHz可调,中心频率ω0处增益可调,20Hz处增益范围从1.431dB到31.81dB,品质因子Q范围从4.635到11.54,12KHz处增益范围从6.495dB到34.05dB,品质因子Q范围从0.48到14.96,此外截止频率都在300dB/dec以上,甚至高达392.39dB/dec,与生物耳蜗响应曲线非常吻合。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

一种高生物拟真性语音处理滤波器与语音识别设备专利购买费用说明

专利买卖交易资料

Q:办理专利转让的流程及所需资料

A:专利权人变更需要办理著录项目变更手续,有代理机构的,变更手续应当由代理机构办理。

1:专利变更应当使用专利局统一制作的“著录项目变更申报书”提出。

2:按规定缴纳著录项目变更手续费。

3:同时提交相关证明文件原件。

4:专利权转移的,变更后的专利权人委托新专利代理机构的,应当提交变更后的全体专利申请人签字或者盖章的委托书。

Q:专利著录项目变更费用如何缴交

A:(1)直接到国家知识产权局受理大厅收费窗口缴纳,(2)通过代办处缴纳,(3)通过邮局或者银行汇款,更多缴纳方式

Q:专利转让变更,多久能出结果

A:著录项目变更请求书递交后,一般1-2个月左右就会收到通知,国家知识产权局会下达《转让手续合格通知书》。

动态评分

0.0

没有评分数据
没有评价数据
×

打开微信,点击底部的“发现”

使用“扫一扫”即可将网页分享至朋友圈

×
复制
用户中心
我的足迹
我的收藏

您的购物车还是空的,您可以

  • 微信公众号

    微信公众号
在线留言
返回顶部