搜索资源列表
WAVE文件格式剖析
- WAVE文件作为多媒体中使用的声波文件格式之一,它是以RIFF格式为标准的。RIFF是英文Resource Interchange File Format的缩写,每个WAVE文件的头四个字节便是“RIFF”。WAVE文件由文件头和数据体两大部分组成。其中文件头又分为RIFF/WAV文件标识段和声音数据格式说明段两部分。WAVE文件各部分内容及格式见附表。-WAVE as a multimedia documents used in the acoustic format, it is based
audio_ostream_demo
- audio_ostream_demo 包括: 如何将Text-to-Speech (TTS) 功能加入到你的程序中; 如何使用comstl和一些stlsoft组件; 如何使用Boost库的iostreams。-audio_ostream_demo include : How to Text-to-Speech (TTS) functions into your program; comstl and how to use some stlsoft components; Boos
fastica
- FASTICA - Fast Independent Component Analysis % % FastICA for Matlab 7.x and 6.x % Version 2.5, October 19 2005 % Copyright (c) Hugo G鋠ert, Jarmo Hurri, Jaakko S鋜el� and Aapo Hyv鋜inen. % % FASTICA(mixedsig) estimates the independent
mfccandvc
- 文章介绍的说话人识别系统,采用能够反映人对语音的感知特性的9(:频率倒谱系数(9(: <+(=>(2/?8(’0+): 81(..-/-(20@,9<88)作为特征参数,同时考虑到特征参数各维分量对于不同说话人的区分程度,采用加权的办法进行矢 量量化。-This paper introduces the speaker recognition system used to reflect the people s perception of voice characte
VCANN
- 人工神经网络中部分组成文件VC程序,包括头文件、前向传播、反向传播等等。-Some of the components of an ANN written by VC.
DTalk
- Microsoft Speech API的Delphi接口及DEMO。语音合成-DTalk, for Delphi, is a set of Speech nabling?components that implement the Microsoft Speech API. Speech applications written with the DTalk controls will work with any Speech API (SAPI) compliant speech recogn
GMM_EM
- 2类分类高斯混合模型 使用k-means的方法来初始化GMM, 基于EM算法计算出GMM模型参量。 测试GMM模型分别有2个,4个,8个混合成分-2-class classifier with Gaussian Mixture Models. Use the k-means method to initialize the GMM’s Then improve the GMM models iteratively based on the EM algo-rithm.
Laplace
- 传统的短时谱估计语音增强算法通常假设语音谱分量相互独立,没有考虑语音谱分量间的相关性。针对这 一问题,该文提出一种新的基于多元Laplace分布模型的短时谱估计算法。首先,假设语音的离散余弦变换(DCT) 系数服从多元Laplace分布,以此利用谱分量间的相关性;在此基础上,利用多元随机矢量的高斯尺度混合模型表 示,推导得到语音DCT系数矢量的最小均方误差(MMSE)估计的解析表达式;并进一步推导了基于该分布模型的 语音存在概率,对最小均方误差估计子进行修正。实验结果表明,该算法