搜索资源列表
VRecognize
- 基于语音特征采样的,实现的特定语音识别代码,准确率90%以上
fenxing
- 为提高语音端点检测(VAD)在较低信噪比(10 dB)下的准确率,提出一种基于短时分形维数的改进算法。结合语音信号的特点,对2种常用的语音信号分形维数计算方法进行了比较和选择,同时采用动态跟随门限值实现语音端点的自适应检测。试验结果表明:对于信噪比6~10 dB的带噪语音,此方法可以实现整段语音的检测,而且具有一定的噪声鲁棒性,系统运行期间能够自适应调整门限值以适应环境噪声的变化,提高了VAD算法的准确率。这个是源码matlab。-In order to improve voice activi
Chinese--NER
- 基于CRF的中文机构名识别系统。使用北京大学1998年的人民日报语料库作为训练语料。除常用的特征模板,已经词性特征外,使用词语的最后一个字作为特征,提高了机构名识别的准确率, 调用了CRF++程序包训练模型。-CRF-based name recognition system of Chinese institutions. People' s Daily, Peking University in 1998 with corpus as training data. In additio
Tone-Recognition
- 一种通过线性规划和曲线拟合,对汉语言进行声调识别的方法,准确率98.9 -One kind of curve fitting by linear programming and, for tone recognition of Chinese language and methods, accuracy 98.9
jiyuneirongdeyinpinjiansuoyan
- 本文根据上述的研究,采用基于Mel倒谱系数特征的隐马尔可夫模型对音 乐进行分类。在音乐特征提取方面,以感知特征和Mel倒谱系数组成特征向量 在音乐分类方面,以隐马尔可夫模型作为分类器,对音乐进行聚类和分类。通过 有监督的学习方式进行聚类,分类时将测试样本归入似然值最大的类别,对同一 音频抽取若干样本,对样本识别结果采用投票法,判定该音频的音乐类别,使分 类的准确率得到进一步的提高。根据上述方法进行了仿真实验,并对实验结果进 行了分析。本文将音频数据分为5类,对4种分类器
ISO_DATA
- 使用动态聚类对于大量音频文件聚类,并且测试准确率-clustering method
11
- 为提高语音端点检测系统在低信噪(0 dB 以下) 下 检测的准确率, 提出了一种基于谱熵的端点检测算法。将每 帧信号分为16 个子带, 选取频谱分布在250~ 3. 5 kHz 并且 能量不超过该帧总能量90 的子带, 计算经过语音增强后的 子带能量以及各子带信噪比, 根据各子带信噪比的不同调整 其在整个谱熵计算过程中的权重, 然后平滑谱熵, 以最终的 谱熵作为端点检测的依据-To improve endpoint detection system in the low
Speech-recognition
- 运行结果表明该说话人识别系统的识别能力是比较理想的,识别率为88 ,语音库3识别不成功的原因主要有两个,一方面3的录音本身噪音相对大些,导致系统很难识别,另一方面,识别系统的算法还不是很理想,导致识别准确率不是100 。- DISTEU Pairwise Euclidean distances between columns of two matrices Input: x, y: Two matrices whose each column
dtmf1
- ht9170芯片的dtmf解码源程序,据作者说有验证过。准确率很高。-ht9170 dtmf decoding chip source, according to the authors say there is validation. The accuracy rate is high.
SpeechSDKDemo
- 微软自带的语言合成和语言识别,语言设别需多次进行声音训练才能提高准确率-Microsoft' s own speech synthesis and speech recognition, language settings do not need to be repeated in order to improve the accuracy of voice training