200字范文,内容丰富有趣,生活中的好帮手!
200字范文 > 直播预告 | AAAI 论文解读:基于生成模型的语音/歌声合成与歌声美化

直播预告 | AAAI 论文解读:基于生成模型的语音/歌声合成与歌声美化

时间:2020-06-16 10:33:56

相关推荐

直播预告 | AAAI 论文解读:基于生成模型的语音/歌声合成与歌声美化

「AI Drive」是由 PaperWeekly 和 biendata 共同发起的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果。我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和交流可能会让知识的传播更加有意义,从而产生更大的价值。

本期 AI Drive,我们邀请到浙江大学计算机科学与技术学院硕士生刘静林,为大家在线解读其发表在 AAAI 的最新研究成果:DiffSinger: Singing Voice Synthesis via Shallow Diffusion Mechanism。对本期主题感兴趣的小伙伴,3月 1日(本周二)晚 7 点,我们准时相约 PaperWeekly 直播间。

直播信息

在对声音频谱的建模中,非周期性的参数影响着清音、呼吸声以及浊音的自然度。但这种参数具有不确定性,简单的损失函数很难进行较好的建模。最近两年,生成式模型在声音合成领域崭露头角,本次报告将围绕生成式模型在声音合成中的应用这一话题,介绍该领域的前沿研究。同时,本次报告还会重点介绍近日热度骤增的歌声合成任务,从现代歌声合成的流水线,到现阶段歌声合成中的难点与瓶颈。最后,本次报告会介绍一类新兴任务:歌声美化。

论文标题:

DiffSinger: Singing Voice Synthesis via Shallow Diffusion Mechanism

论文链接:

/abs/2105.02446

代码链接:

/MoonInTheRiver/DiffSinger

本次分享的具体内容有:

生成式模型建模声音频谱的前沿研究

歌声合成任务

歌声美化任务

嘉宾介绍

刘静林/ 浙江大学硕士生

刘静林,浙江大学计算机科学与技术学院二年级研究生。 年于浙江大学竺可桢学院混合班(计算机科学与技术专业)本科毕业,保至本校攻读硕士研究生。研究方向为自然语言处理,包含:语音&歌声合成、机器翻译、唇语识别&合成,专注于深度生成模型在自然语言处理中的应用。在 AAAI、ACL、NeurIPS 等国际人工智能顶级会议上发表论文 10 余篇。相关开源仓库收到学术界与工业界的广泛关注。

直播地址& 交流群

本次直播将在 PaperWeekly 视频号和 B 站直播间进行,扫描下方海报二维码点击阅读原文即可免费观看。线上分享结束后,嘉宾还将在直播交流群内实时 QA,在 PaperWeekly 微信公众号后台回复「AI Drive」,即可获取入群通道

视频号直播间:

扫描下方二维码关注 PaperWeekly 视频号,第一时间获取开播提醒。

B 站直播间:

/14884511

合作伙伴

🔍

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

·

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。