我做项目,对两个人对讲的声音数据保存,要求数据量每小时不超过6MB(大概每小时有10分40秒在讲话,其余是静音),那么如何
对录取到的对讲声音最高限度地压缩,当然要保证质量,用那种压缩方法最好!?
另外要求保存声音数据后后,能够查听任意时刻的对讲信息,即我输入一个时间,马上就能定位到对应那个时刻的对讲数据,怎么做???难道我要自己编写声音文件的格式!?大家帮帮我吧!?
你有没有语音编码/或者通信编码方面的基础啊? 如果没有,先恶补一下基本概念吧。不然你根本不会搞懂任何东西的。
语音压缩也可以参看语音数字信号处理方面的语音压缩章节。
西电刚好出了一套相关方面的书。有本就是《语音编码》。你先去看看。了解一些基本概念和实现思路。然后,再看现成的模型有没有适用的,拿来用就OK了。要自己开发套压缩算法不太现实。书不贵,新华书店保证有卖。相关的资料也多了解些!到德州仪器的中文站点看看
www.ti.com.cn 上面的连接很有用!
如果你是在windows平台上开发的话可以采用Windows Media Encoder SDK把采集下来的声音压缩为WMA格式,甚至可达4M每小时。
我以前做过的。
8k采样
g723.1 每小时2m多
adpcm 也就3m多