首页出版说明中文期刊中文图书环宇英文官网付款页面

基于SV2TTS的在线慕课视频自动生成系统设计与实现

郭 辉1, 刘丽 景1, 陈群 心1, 刘怡 凡1, 杨智 钦1, 薛婷 之1
1.西安培华学院 陕西省西安市 710125;2.西安交通大学 陕西省西安市 710049

摘要


摘要:本文设计一种基于SV2TTS(Speaker Verification to Multispeaker Text-To-Speech)技术的在线慕课视频自动生成系统,能够自动地将PPT课件和相应的讲解文本转化为慕课视频,通过语音克隆技术合成讲解者的语音并嵌入到视频中,最终生成适用于在线教学的慕课视频。系统基于SV2TTS、POI、FFmpeg等技术进行实现,本文对系统总体架构设计和系统处理流程与具体实现进行了详细的阐述。本系统能够快速的将线下课程转化为线上慕课,极大提高学校数字化课程建设进程。

关键词


关键词:SV2TTS;在线慕课;语音克隆;FFmpeg

全文:

PDF


参考


[1]雷巧娟.智慧理念视域下的微课自动生成系统设计[J].自动化技术与应用,2020(06):144-147.[2]曾永安.基于多技术融合的在线教育平台设计.自动化技术与应用[J].2019,38(10),142-145.[3]ChangyanZ,JibinY,XiongweiZ,etal.ImprovingtheperformanceofspeechwaveformsynthesisusingWaveNetfusedwithphaseinformation[J].ChineseJournalofAcoustics,2022,41(01):1-19.[4]丁云涛,才让卓玛,贡保加等.一种基于WaveNet的藏语语音合成方法[J].计算机仿真,2023,40(01):295-299+538.[5]孟利,沈郑燕,张泰雯.基于FFmpeg提取目标人物语音的应用研究[J].信息系统工程,2023(03):74-76.[6]余海鑫,丁航,李文邦.基于Vapoursynth和FFmpeg的视频编辑[J].电子世界,2022(01):164-165+167[7]褚建萍.基于Vue的数据可视化系统研究[J].电子技术与软件工程,2022(18):234-237.[8]郭艳华.基于Vue框架的海量数据处理系统设计[J].信息与电脑(理论版),2022,34(23):16-18.[9]何运田,张青清.基于Kong和Elasticsearch的私有云API网关及监控系统的设计与实现[J].计算机应用与软件,2022,39(11):136-140.[10]刘祥,胡瑞敏,王海滨.基于Kubernetes的AI调度引擎平台[J/OL].计算机系统应用:1-9[2023-07-07].[11]刘祥,胡瑞敏,王海滨.基于Kubernetes的AI调度引擎平台[J/OL].计算机系统应用:1-9[2023-07-07].[12]刘斐瑜,俞卫琴.融合BERT与注意力的文本情感分析模型[J/OL].软件导刊:1-6[2023-07-07].[13]佟国香,李乐阳.基于图神经网络和引导向量的图像字幕生成模型[J].数据采集与处理,2023,38(01):209-219.




DOI: http://dx.doi.org/10.12361/2661-3476-06-04-157884

Refbacks

  • 当前没有refback。