1、任务描述用自己熟悉的输入方法输入范文内容,或使用“科技文章素材.doc”,然后以“科技文章.doc”为文件名保存;文稿要求用计算机打印在A4(297*210)纸上;文稿必须包括中英文题名、作者姓名、作者单位、中英文摘要和关键词、中图法分类号、正文、参考文献;论文章节编号采用三级标题顶格排序。一级标题形如1,2,3.排序,二级标题形如1.1, 1.2,.;2.1,2.2,.排序,引言不排序。 参考文献作者署名,不多于三人全部著录,超过三人,第三人后加“等”(et al)。无论中英文署名,一律姓先名后。参考文献著录方法及书写规范如下:1) 期刊或杂志: 序号 文章作者名1,名2,名3,等. 文章名
2、 J. 杂志名, 年, 卷(期): 起止页码。2) 书或专著:序号 著者名. 书名M. 出版社所在城市名: 出版社名, 出版年: 起止页码。3) 论文集: 序号 文章作者名. 文章名 A. 论文集编者. 文集名C. 出版地所在城市名:出版社名, 出版年: 起止页码。结果参见图基于模糊聚类表征的音频例子检索及相关反馈吴某某,赵某某(浙江大学,杭州,310027)摘要:避免先前基于例子的音频检索要按照监督机制训练不同类别的复杂的音频模板,一种新的基于非监督机制音频例子快速检索方法被提出来。其步骤如下:首先从原始音频流中提取压缩域特征,然后使用时空约束机制实现压缩域特征的模糊聚类,用聚类质心来表征整
3、个音频例子。关键词:音频检索;时空约束;模糊聚类;相关反馈中图分类号:TP391.4 Audio Clip Retrieval and Relevance Feedback based on the Audio Representation of Fuzzy ClusteringWU , ZHAO (Zhejiang University, Hangzhou, 310027)Abstract: Avoiding generating audio template by supervised learning and find similar audio clip based on pre-tr
4、ained audio template, every audio clip is presented by limited number of centroids which is extracted by unsupervised learning algorithm. Audio features such as Centroid, Rolloff, Spectral, Flux and RMS are extracted from each overlapping audio frame in the original compressed domain. Keywords: Audi
5、o Retrieval Time-Spatial Constraint Fuzzy Clustering Relevance 作为多媒体重要媒质之一的音频蕴涵了丰富语义,从90年代中期开始的基于内容音频检索就研究如何提取音频信息流中的语义信息,以实现对音频数据进行检索1:如在“Muscle Fish”中2,每个音频例子的MFCC等特征被提取,然后归一化欧氏距离用来判别提交的检索音频属于音频数据库中哪一类,这种方法取得了81%左右正确率;提取音频例子中12个MFCC系数和1个能量特征3,对语音、笑声、雨声和双簧管音等6类不同音频类别构造量化树,将每个量化树作为相应类别音频的模板,然后用余弦距离进
6、行相似度量,取得了77.2%的检索平均正确率;采用监督式的学习机制,从每个音频帧中提取感知和物理特征4,为每类音频训练支持向量学习机,取得了平均80%左右检索正确率。1 音频例子表征与检索1.1 MPEG压缩域音频特征提取MPEG音频压缩利用了“心理声学模型(psychoacoustics model)”,在MPEG压缩领域上直接提取特征,可以保留这些感知特性,实现对音频语义内容的理解。1) 压缩域特征高斯化处理1.3 音频例子相似度比较 既然每个音频用个质心来表征,那么两个音频之间的相似度就可以通过质心来计算。3 总结与今后工作本文介绍了基于非监督约束机制的音频检索及相关反馈算法,并且实时实
7、现了这样的原型系统。在模糊聚类因子取为11和聚类质心数目取为6时,系统查全率和查准率均超过90%,比其它算法取得了更高效率。参考文献1 Foote J T, An overview of audio information retrieval J, Multimedia Systems, 1999 7(1): 2-112 E.Wold, T.Blum, D.Keislar(et al), Content-based classification, search and retrieval of audio J, IEEE Multimedia Magazine,1996, 3(3):27-363 Jonathan T. Foote, Content-Based Retrieval of Music and Audio, C.C. J. Kuo (editor) J, Proceeding of Multimedia Storage and Archiving Systems II, SPIE, 1997, 138-147