[语音驱动论文]基于双层码本的语音驱动视觉语音合成系统

时间:2015-01-17 09:29:22 作者:贾熹滨;尹宝才;孙艳

本文作者:贾熹滨;尹宝才;孙艳丰;成功正常投稿发表论文到《计算机科学》2014年01期,引用请注明来源400期刊网!


如果您需要快速发表论文服务,请联系在线编辑!


【摘要】:提出了一种基于双层码本的语音驱动视觉语音合成系统,该系统以矢量量化的思想为基础,建立语音特征空间到视觉语音特征空间的粗耦合映射关系。为加强语音和视觉语音的关联性,系统分别根据语音特征与视觉语音特征的相似性两次对样本数据进行自动聚类,构造同时反映语音之间与视觉语音之间相似性的双层映射码本。数据预处理阶段,提出一种能反映视觉语音几何形状特征与牙齿可见度的联合特征模型,并在语音特征LPCC及MFCC基础上采用遗传算法提取视觉语音相关的语音特征模型。合成的视频中图像数据与原始视频中图像数据的比较结果表明,合成结果能在一定程度上逼近原始数据,取得了很好的效果。
【论文正文预览】:1引言语言是自然人进行交流的主要方式,在人交谈中,除了声音外,人说话时的口形、表情、手势等都是加强语言理解的不可或缺的因素,因而有研究者提出将人类这种自然的交流方式用在人机交互中,提供包括声音语音、视觉语音、表情等多通道交互方式,提高人机交互的自然性和逼真性[1,
【文章分类号】:TN912.3
【稿件关键词】:双层码本视觉语音合成视觉语音特征语音特征
【参考文献】:
【稿件标题】:[语音驱动论文]基于双层码本的语音驱动视觉语音合成系统
【作者单位】:北京工业大学多媒体与智能软件技术北京市重点实验室;
【发表期刊期数】:《计算机科学》2014年01期
【期刊简介】:本刊以其新颖、准确、及时为特色,突出动态性、综述性、学术性。报告特点是:“前沿科学”与“基础研究”相结合;“核心技术”与“支撑技术”相结合;“倡导”与“争鸣”相结合。广采百家之长,博览计算机世界之态势。重在突出文章的思想性,令人有开拓思路之......更多计算机科学杂志社(http://www.400qikan.com/qk/1234/)投稿信息
【版权所有人】:贾熹滨;尹宝才;孙艳丰;


更多科技类论文详细信息: [语音驱动论文]基于双层码本的语音驱动视觉语音合成系统 论文代写
http://m.400qikan.com/lw-18299 论文代发

相关专题:科学论文1000字 和谐社会

相关论文
相关学术期刊
《高原医学杂志》 《中国现代神经疾病杂志》 《中华女子学院学报》 《拳击与格斗》 《世界汉语教学》 《中原文物》 《中国修复重建外科杂志》 《中华麻醉学杂志》 《赣南师范学院学报》 《农业环境科学学报》

< 返回首页