搜索资源列表
CorrelogramFrame
- Compute one frame of a correlogram. The input data is a two-dimensional array of cochlear data, each row representing firing probabilities from one cochlear channel. The output picture is a two dimensional array of width \"picWidth\".-Compute
Energynormalization
- Speech Recognition - Numbers 1 to 5 Energy normalization and time alignment References: [1] L. Rabiner and B.H. Juang,Fundamentals of Speech Recognition, Prentice-Hall, 1993. % [2] P.E. Papamichalis, Practical Approaches to Speech Coding, Pre
EnergyNormalizationCepSpec
- Speech Recognition - Numbers 1 to 5 Energy normalization and time alignment References: [1] L. Rabiner and B.H. Juang,Fundamentals of Speech Recognition, Prentice-Hall, 1993. % [2] P.E. Papamichalis, Practical Approaches to Speech Coding, Pre
SpeechSignalAcquisitionandAnalysis
- 实现语音的采集,滤波,A/D转换,短时能量,短时过零数,线性倒谱分析-Speech Signal Acquisition and Analysis
ogrady2007_phd
- 国外欠定语音盲分离的博士论文,作者为Paul D. O’Grady,LOST算法的作者。该博士论文包括语音信号分离,非负矩阵分解等内容。-Sparse Separation of Under-Determined Speech Mixtures,A dissertation submitted for the degree of Doctor of Philosophy
speakerrecognization
- 摘要说话人识别在自动身份鉴别方面具有重要的现实意义。文章在分析了说话人识别实现的可行性基础上*提 出采用长时线性预测倒谱 +,--.,)系数和矢量量化 /0)模型的不依赖于文本的说话人识别方法,并成功地应用于 一个数据库查询系统中。-65DL5<?E5=7?9?AD7?8=CDH H?>=?9?AD=7 D66@?AD7?8=H?=D 78:D7?A?=E?G?E D@<5A8>=?7?8=D<5D#M=7C?H 6D65<* 7C5 68HH?N
dianhuabohaoyuyinshibie
- 双音多频 DTMF( Dual Tone Multi-Frequency )信号,是用两个特定的单 音频率信号的组合来代表数字或功能。在 DTMF 电话机中有 16 个按键,其中 10 个数字键 0 — 9 , 6 个功能键 * 、 # 、 A 、 B 、 C 、 D 。其中 12 个按键是我们比较熟悉的按键,另外由第 4 列确定的按键作为保留,作为功能 键留为今后他用。 根据 CCITT 建议,国际上采用 697Hz 、 770Hz 、 852Hz 、 94lHz 低频群及
mfccdtw
- 先用端点检测将语音中有用的语音部分提取出来(即将头部和尾部的静音部分除掉),然后用LPC算法提取语音信号的特征参数,进行动态归整(DTW算法)后与模板库里面的标准语音作比较,最后将识别结果进行D/A转化后播放出来。在本部分的设计中,则主要完成语音识别的模式匹配算法部分的软件实现。 -First with the endpoint detection of speech to voice some of the useful extracted from the (soon to mute som
mic1
- There are four major types of adaptive filtering configurations adaptive system identification, adaptive noise cancellation, adaptive linear prediction, and adaptive inverse system. All of the above systems are similar in the implementation of the al
Fundamentals_of_Speech_Recognition
- 一本有关语言识别方面的参考书,可以帮助从事语言识别方面研发和编程的朋友-A reference area for speech recognition, speech recognition can help in the programming aspects of R & D and friends
ld3320
- LD3320 是一颗基于非特定人语音识别(SI-ASR:Speaker-Independent Automatic Speech Recognition)技术的语音识别/声控芯片。提供了真正的单 芯片语音识别解决方案。 LD3320 芯片上集成了高精度的A/D 和D/A 接口,不再需要外接辅助的 Flash 和RAM,即可以实现语音识别/声控/人机对话功能。并且,识别的关键词 语列表是可以动态编辑的。-Voice Recognition ;Speech Recognition
MMSE
- 本程序为经典MMSE方法,引自Y. Ephraim and D.Malah “Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator-Ephraim and D.Malah “Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator
yuyinshiyan
- (1) 使用录音软件或者Matlab函数,分别采集一段浊音和清音语音信号(是你自己说的,如:a,o,s等),采样率为8KHz,量化精度为16比特线性码,存在自己指定的目录下,例如D盘根目录下叫sound的文件夹中,录音文件名为yourfilename_a.wav,yourfilename_s.wav等。录音的软件和Matlab函数的使用见随后的附录。 (2) 根据语音信号的短时平稳特性,分析帧长取30ms(或10ms~50ms); (3) 利用上述基音提取的三种方法(任选两种方法)的编程
chenxu
- (1)录制一段语音信号,完成对信号的采样,画出信号的时域波形和频谱图,确定信号的频谱范围; (2)给信号叠加噪声(噪声类型分为如下几种:a白噪声;b单频噪色(正弦干扰);c多频噪声(多正弦干扰);d其它干扰。),画出受噪声干扰的信号时域波形和频谱图; (3)采用窗函数法设计FIR低通滤波器,画出滤波器的频响特性图; (4)用所设计的滤波器对受噪声影响的信号进行滤波,画出滤波后语音信号的时域波形图和频谱图; (5)对滤波前后的信号进行对比,分析信号的变化;回放语音信号,并与原始语音信号对比
