收藏 分享(赏)

网络综艺节目发展现状及趋势研究16.83.doc

上传人:晚风 文档编号:4173371 上传时间:2021-07-23 格式:DOC 页数:9 大小:38.50KB
下载 相关 举报
网络综艺节目发展现状及趋势研究16.83.doc_第1页
第1页 / 共9页
网络综艺节目发展现状及趋势研究16.83.doc_第2页
第2页 / 共9页
网络综艺节目发展现状及趋势研究16.83.doc_第3页
第3页 / 共9页
网络综艺节目发展现状及趋势研究16.83.doc_第4页
第4页 / 共9页
网络综艺节目发展现状及趋势研究16.83.doc_第5页
第5页 / 共9页
亲,该文档总共9页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、接受采样。2.3.6 预期目标(1) 病人的数量录取200名以上帕金森病人的语音数据(至少要有5个元音),以及对应的UPDRS(包括运动、整体),同时每个病人至少要录取一种状态。尽量保证病人患病的程度均匀分布。病人的语音数据,每个病人至少要录取一次。(2) 语音的质量需要尽量保证录音的质量(杂音要少,时间不能过长,声音不能过小,保证元音的不间断性)。3 语音信号预处理采集的语音信号不能直接使用,需进行一定的预处理。此操作可以去掉一些干扰因素,并可以为之后的特征提取打下基础。许多实验都证明了预处理的重要性,其对最终结果的影响比较大33。语音信号预处理主要功能为对声音做采样频率转换、预加重、加窗、

2、分频、无声部分切除等处理,可能还需要计算基音频率等参数。本次实验使用Matlab R2017a作为处理工具。3.1 格式转换目前,已经使用过多种不同品牌不同型号的手机进行语音录制,发现录制出的语音文件略有不同:(1) 苹果的手机所录得的音频文件默认格式为M4A格式,采样频率为44100 Hz,并且为双声道。(2) 安卓的手机所录得的音频文件格式就不太统一,有WAV格式,有MP3格式,偶尔也有WMA格式的,但是采样频率都为44100 Hz,并且为双声道。所以为了保证所有的音频文件统一,在用来录音的手机应用上,加上了一个音频格式转换包,由于手机应用前端的部分并不完全由我完成,这里不详细介绍。最终将

3、不同的音频文件的格式统一成WAV格式,同时采样频率为44100 Hz,并且为双声道。之后再将这些音频文件上传到后端的服务器中保存。3.2 采样频率转换采样频率转换,即重采样,可以统一录制语音的频率,能通过降频来减少计算量。通常目前用于通话的语音,又称电话带宽语音(Telephone Speech),其频带在3003400 Hz的范围内。根据奈奎斯特采样定理34,采样率至少需要6800Hz,但是目前的通信采样率多为8kHz。但是实际的语音信号处理中,采样率常为10kHz33。 本次实验中首先只保留语音信号的一个通道(左声道),接着将采样频率转换为10kHz(常用且方便计算),实现的时候使用res

4、ample函数。3.3 预加重预加重即滤掉低频,增加高频。由于口唇辐射,经由预加重,语音信号的高频部分会被提高,从而高频分辨率会变高。其原因是由于语音信号的平均功率谱受声门激励和口鼻辐射影响,高频端大约在800HZ以上按6dB/倍频程跌落33,所以随着频率的升高,有用的信号所占的比例会逐渐降低,且频率低的部分本来就极易包含噪音(例如50Hz的工频干扰),所以需要进行预加重。本次实验中使用了一阶FIR高通数字滤波器来实现预加重,其传递函数为: (3.1)其中a为预加重系数,一般,设n时刻的语音采样值为,经过预加重处理后的结果为,本次实验取a=0.9375。图3.1 高通滤波器的幅频和相频特性图3

5、.2 预加重前后的时域和频域对比图3.1展示了FIR滤波器的幅频特性和相频特性,图3.2展示了语音信号经过预加重前后的时域和频域的变化,从图中看出该滤波器成功的完成了预加重的工作。3.4 加窗和分帧在经过了预加重处理后,还需要分别进行加窗处理和分帧处理。经过研究,语音信号具有短时平稳性,即可以认为语音信号的各种特性在1030ms几乎不变,这样就可以把语音信号分为许多个小段(帧)来进行处理,这就是分帧。而通常为了去掉每一帧的边缘处突变的问题,就需要对每一帧进行加窗处理33。分帧通常用有限长的窗进行平移并加权。每秒的帧数取33100帧比较好,但还需要视具体问题来选择。最常用的方法为交叠分帧法,即为

6、了保证帧的边缘信息不丢失,相邻帧之间会有重叠,重叠的大小称为帧移,而每一帧的信号长度为帧宽。帧移与帧宽的比常取00.5。本次实验使用的帧宽为25ms,帧移为10ms,同时使用汉明窗来进行加窗处理。3.5 无声判别因为无法保证得到的音频文件一直都有声音,所以需要滤掉那些声音的空白期,那么就需要无声判别(也称为语音端点检测)。常用的方法是使用双门限法33,双门限法的原理是使用短时能量或短时平均幅度和短时过零率。本次实验为了简便和快速,只采用短时能量。图3.3 双门限法原理双门限法的原理如图3.3所示,首先需要设置两个门限:高门限和低门限,其中高门限可以确定语音已经开始,低门限可以来判断已经确认开始

7、的语音的起始点和终止点。可以总结成下文:(1) 高门限:有声部分必须有高于高门限的部分。(2) 低门限:有声部分的端点能量等于低门限。短时平均能量的定义是: (3.2)其中w是使用的窗,即之前的汉明窗。经过多次尝试,由手机录得的音频使用高门限=0.05,低门限=0.02的时候,便可以很好的进行无声判别。无声判别的结果如图3.4所示。图3.4 无声判别3.6 基频提取基音频率 (fundamental frequency),简称为基频,指的是声音中最低且理论上最强的频率,这个频率在一定程度上可以被认为是声音的基础音调,而这个频率其对应的声音便是基音(fundamental tone)。通常基频的

8、大小可以在一定程度上反映了声源的振动频率,即声带的振动频率。3.6.1 基音估计方法基音是语音信号的重要参数,自对语音分析研究开始以来,基音的检测一直是一个重要的课题,目前已经有许多种方法被提出,但是这些方法大多有局限性,至今仍未发现可以适用于不同人群、不同要求、不同环境的完善的算法。所以找到一个好的基频的提取方法比较困难,通常要根据具体情况来选择。表3.1列举出了几种比较常见的基音估计方法。表3.1 常见的基音估计方法类别基音提取法特征波形提取法并行处理法由多种简单的波形峰值检测器决定提取的多数基音周期数据减少法根据多种方法,从波形中去掉修正基音脉冲以外的数据过零数法通过波形的过零数相关处理

9、法自相关法及各种改进对语音波形进行自相关,可以通过削波来提速SIFT法降低语音波形取样,进行LCP分析AMDF法使用AMDF检测周期变换法倒谱法对数功率谱的傅立叶逆变换分离频谱的包络循环直方图在频谱上,求出基频高次谐波成分的直方图,并求其公约数3.6.2 自相关法本次实验,综合多方面考虑,采用了最为常见的自相关法来进行基频的提取,其特点是可解释性强,同时适合于这种快速的语音处理手机应用。自相关法其计算比较简单,就是利用自相关函数进行基频的估计。首先需要对之前提取的每一帧语音信号进行短时自相关计算。对于确定伀攀眀愀瀀瀀栀琀洀氀侻焣/Mi前台访问/p-1420294.html123.123.219

10、.700鈈呖挀礀眀愀瀀漀漀欀刀攀愀搀愀猀瀀砀椀搀侾焣/Mi前台访问/d-2870277.html116.179.32.2420鈊勈嚄劰愀紀漀漀欀刀攀愀搀愀猀瀀砀椀搀堀俀焣/Ie前台访问/p-72465.html123.183.224.640鈌勈嚄椀搀栀琀洀氀萀俁5Sowap前台访问/p-1300743.html116.179.32.2430鈎勈嚄劰欀瀀栀琀洀氀萀俁/Mi前台访问/d-2318126.html185.191.171.130鈐最瀀栀琀洀氀俆/Mi前台访问/p-2650413.html185.191.171.130鈒%椀瀀栀琀洀氀俊娃/Mk前台访问/p-2854504.html123

11、.183.224.1720鈔椀瀀栀琀洀氀栀俎娃/Ie前台访问/p-49221.html123.183.224.310鈖欀瀀栀琀洀氀囓鑔俏/G前台访问/p-9961.html221.4.34.90鈘%襱匀漀眀愀瀀搀栀琀洀氀俐娃/Mi前台访问/p-2873257.html116.179.32.1720鈚勈嚄欀搀栀琀洀氀葒俓/Mk前台访问/p-2806250.html122.114.146.1390鈜勈嚄膹嬀漀漀漀欀刀攀愀搀愀猀瀀砀椀搀瀀俕娃/Mi前台访问/p-2849616.html185.191.171.350鈞欀瀀栀琀洀氀葒俚/Ie前台访问/c-00004.html116.179.32.229

12、0鈠%椀瀀栀琀洀氀保/Me前台访问/p-2689102.html60.172.82.240鈢%椀瀀栀琀洀氀葒呖俢録/Mg前台访问/d-1681732.html207.46.13.2030鈤椀搀栀琀洀氀葒俤録/a前台访问/BookRead.aspx?id=2873310211.97.105.1430鈦勈嚄欀褀琀愀最搀漀渀最挀栀攀稀甀刀戀椀愀渀洀攀渀栀琀洀氀俨娃/Mg前台访问/p-2872976.html106.12.155.620鈨攀瀀栀琀洀氀尀俩焣5Smwap前台访问/d-2850135.html116.179.32.760鈪勈嚄膹愀笀漀漀欀刀攀愀搀愀猀瀀砀椀搀俯5Smwap前台访问/d-24

13、58630.html116.179.32.820鈬%最搀栀琀洀氀葒俯浒5Sqwap前台访问/p-1127245.html220.181.108.1730鈮%椀瀀栀琀洀氀持俳鶔/Mg前台访问/p-2108229.html106.12.155.620鈰%最瀀栀琀洀氀持俶絔/Mk前台访问/p-2870337.html220.181.108.1170鈲襱最瀀栀琀洀氀葒顖俸/Ie前台访问/c-00011.html61.163.165.2090鈴勈嚄欀搀栀琀洀氀葒顖俸仒/m前台访问/tag/2018nianhuaihuahuaxue.html116.179.32.410鈶勈嚄愀笀漀漀欀刀攀愀搀愀猀瀀砀椀搀

14、俹/Mi前台访问/d-2768365.html185.191.171.340鈸%琝最瀀栀琀洀氀俹5Smwap前台访问/p-1575715.html106.11.156.380鈺匀洀眀愀瀀瀀栀琀洀氀葒俺浒5gwap前台访问/BookRead.aspx?id=1575715106.11.154.480鈼最脀眀愀瀀漀漀欀刀攀愀搀愀猀瀀砀椀搀俼5Sowap前台访问/p-2623753.html183.192.164.970鈾%匀焀眀愀瀀搀栀琀洀氀葒俼浒5Smwap前台访问/p-1356368.html42.120.160.980鉀%琝椀瀀栀琀洀氀葒俽浒5ewap前台访问/BookRead.aspx?id=388592106.11.154.750鉂勈嚄椀搀栀琀洀氀葒俽仒/_前台访问/BookRead.aspx?id=61571342.120.161.1090鉄愀紀漀漀欀刀攀愀搀愀猀瀀砀椀搀俿砀馰/Mi前台访问/p-2861929.html220.181.108.990鉆聠最脀眀愀瀀漀漀欀刀攀愀搀愀猀瀀砀椀搀倀/Ie前台访问/p-92152.html123.

展开阅读全文
相关资源
相关搜索
资源标签

当前位置:首页 > 应用文书 > 工作报告

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:文库网官方知乎号:文库网

经营许可证编号: 粤ICP备2021046453号世界地图

文库网官网©版权所有2025营业执照举报