搜索结果: 136-150 共查到“知识库 语音处理”相关记录400条 . 查询时间(2.343 秒)
用于人形机器人的声音降噪方法
人形机器人 声音降噪 麦克风阵列
2009/8/12
用于人形机器人的实时多通道降噪方法使机器人能够在实际应用中精确地进行后续的音频分类或语音识别。引入人形机器人具有类似人体的头相关传输函数的性质,避免一般方法中在估计声传播信道模型时只考虑声达时延,而忽略声散射和共振影响的局限性。该方法通过利用麦克风阵列阵元之间的声音传输信道的差异性,削弱参考噪声和目标信号之间的相关性,从而提升对消噪声后输出信号的信噪比。仿真表明,对目标信号的信噪比提升达到15 d...
基于UBM的发音质量评价算法
对数似然比 高斯混合模型 发音质量评价
2009/8/10
将已经成功应用到说话人识别/确认领域中的高斯混合模型和全局背景模型(UBM)引入语音发音质量评价领域,提出一种新的评价英语发音质量的算法。该算法训练出标准发音的全局背景模型。UBM模型描述与音素无关的特征分布,定义段时长归一化的相似度比例对数为音素的发音质量分数,综合得到整句发音的评分结果。实验证明,在实验室自行采集的非母语语音数据库上,该算法评分与专家评分的相关性达到了0.700,优于其他评分算...
为了提高说话人分割(SS)准确率,该文综合考虑了静音信息和性别信息在SS中的作用,提出了一种两步判决的SS算法。在从音频流中分离出语音段的基础上,采用两步判决的方法进行SS。第1步采用基频信息为主、性别模型为辅的策略进行SS,将相邻说话人基频差异大的说话人改变检测出来;第2步采用基于性别的改进T2判决公式进行SS,实现相邻说话人基频差异小的同性别SS,为此,该文提出了一个基于块的潜在说话人改变点检...
基于DSP5410与TLC320AD50C的实时音频信号处理研究
DSP 音频信号处理 放大器
2009/8/4
介绍一种高保真的音频信号处理系统,给出了前端音频信号调理电路设计,实现了DSP芯片TMS320VC5410与语音转换芯片TLC320AD50C的硬件接口设计,并通过FIR算法实现了对音频信号的处理。测试结果表明,此音频处理系统达到预期要求。
一种新型基频变窗音频信号分析/合成系统
基频估计 正弦成分 噪声成分
2009/8/4
音频信号短时谱的基频随时间会发生变化,因此其谐波成分之间的间隔也会发生变化,在时域上信号随时间会发生或快或慢的变化,这导致短时谱分析所要求的时域和频域分辨率随时间是变化的。传统的固定分析窗由于其时频分辨率固定,无法同时满足上述要求,因而对短时分析造成偏差。本文基于正弦加噪声模型提出了一个分析窗宽受基频控制的自适应新型音频信号分析/合成系统方案,有效地提高了对信号实时分析的精度。并在此基础上,进一步...
用TMS320C6201实现多路ITU-TG.728语音编码标准
语音编码 ITU标准 DSP
2009/8/4
ITU-T G.728标准是国际电信联盟于1992年制定的比特率为16kbit/s的低延时CELP类语音编码器。在扼要介绍G.728编解码算法原理和TMS320C6201定点DSP芯片的基础上,详细讨论了G.728算法在TMS320C6201上实时实现的硬件设计和软件开发及优化的关键技术。实验结果表明,单片C6201能实现至少4路G.728语音编解码。
基于人耳掩蔽效应的电子耳蜗语音增强方法
电子耳蜗 语音增强 掩蔽效应 Bark子波
2009/7/31
提出一种符合人耳听觉感知的语音增强方法,使电子耳蜗能在噪声环境下获得准确的语音信息。利用Bark子波变换实现电子耳蜗中的语音处理,结合人耳听觉系统特性实现语音增强。使用根据人耳听觉掩蔽效应提出的自适应减参数。实验结果表明该算法在低信噪比情况下,信噪比可提高30 dB左右,更好地抑制了残留噪声和背景噪声,合成的语音具有较好清晰度和可懂度。
数字可视电话系统中的G.168回声消除技术
回声消除 NLMS算法 滑动窗自适应滤波器
2009/7/30
由于数字可视电话系统的性能需求和系统中回声的特点,传统的回声消除技术应用于数字可视电话系统时无法满足ITU-T G.168标准要求。该文利用NLMS算法的滑动窗自适应滤波器和简化非线性处理器设计,实现一种数字可视电话系统中的G.168自适应回声消除器,介绍其基本结构和各个功能模块的算法,并以ARM 920T为硬件平台实现该系统。仿真结果显示,简化的回声消除算法运算复杂度小、消除回声有效性高、稳定性...
协方差斜格法的LPC参数提取及其FPGA实现
语音信号 声道模型 特征参数
2009/7/30
分析语音信号声道特征参数提取问题,针对自相关法的缺陷,提出声道特征参数提取的改进算法。介绍其运算步骤和流程,考虑FPGA适于短期开发及高速性的优点,设计Finite State Machine来控制复杂运算操作及对寄存器的频繁访问。利用Cyclone EP1C6 FPGA实现语音信号声道特征参数提取算法。
室内语音源定位技术中的时间延迟估计方法
分数低阶协方差 声门脉冲 线性预测
2009/7/29
针对室内的脉冲噪声居多的情况下,结合语音信号的特征,提出了基于声门脉冲提取的分数低阶协方差时延估计方法(LPC+FLOC),通过理论分析和仿真实验表明,具有较好的时延估计有效率,且抗混响能力较强,比较适合室内的语音源定位。
Speech Pre-Processing for Pitch and Pitch-Cylce Evolutions Smoothing
Pitch speech coder bit rate pitch cycle
2009/7/28
In low bit rate speech coders, pitch is usually transmitted once per frame and, when needed, the intermediate pitch values are obtained by interpolation between 2 adjacent pitch values. Although pitch...
低延迟低码率语音编码研究
低延迟 低延迟语音编码算法 自适应码书
2009/7/23
现有的低延迟语音编码算法(LD-CELP)需要16 kb/s比特率,无疑会妨碍它的应用。提出了一种采用两阶段码书搜索的方法可以在提高低延迟语音编码算法性能的同时降低码率。首先构造了两个子码书:一个后向更新的自适应码书和一个具有代数结构的固定码书;然后设计了两阶段码书搜索方法使滤波后的激励矢量和目标矢量之间的均方误差保持最小。这样就得到了一个在8 kHz采样率下具有2.5 ms延迟的10 kb/s两...
二维维纳滤波语音增强方法研究与实现
语音增强 乐性噪声 平均主观得分
2009/7/22
充分考虑语音的短时相关性和叠接帧的存在,实现了一种二维形式维纳滤波。采用多帧组合成块的结构进行二维加窗滤波,然后辅以局部平滑的技术,可以有效抑制噪声,并防止乐性噪声出现。在二维维纳滤波方法与一维维纳滤波的对比实验中,采用TIMIT语音数据库,加上指定信噪比的白噪声,实验结果表明前者不但在后者基础上又显著提高了信噪比客观参数,而且MOS主观得分提升了13.8%。
复子波提取语音信号特征信息
相位谱 基音周期 共振峰
2009/7/22
对时变性强的非平稳汉语语音信号,建议采用变时-频复子波分析方法提取汉语语音信号的幅度谱、相位谱、基音周期及共振峰信息。选择有n阶消失矩及良好的时频局域化特性的复高斯子波提取汉语语音信号的幅度谱和相位谱,实验结果表明,该方法提取的语音信号的幅度谱、相位谱和子波变换谱表征了汉语语音的音节包络、细节包络及声调,区分了清、浊音,并准确提取了语音信号的动态基音周期、估计出共振峰。这对汉语语音特征提取和识别提...
改进的SOFM算法及其在低延迟语音编码中的应用
自组织特征映射神经网络 自适应调整 低延迟语音编码
2009/7/22
根据低延迟语音编码算法训练码书的尺寸和码字维数的特点,提出了一种改进的自组织特征映射(SOFM)神经网络的码书设计方法。对输入训练矢量以及连接权矢量进行归一化,为降低计算量和提高码书训练质量,采用快速的网络学习决定获胜的神经元并对网络权值分阶段进行自适应调整,最后应用于低延迟语音编码中。实验表明,与传统LBG算法比较,采用SOFM神经网络训练的码书其合成语音的主、客观质量均有较大提高。
...