数字人
原创大约 2 分钟
数字人最开始是用于代替主播实现全天候无人值守,2023年的时候就有了腾讯智影,它应该是国内在这方面做的比较早的的应用之一。
其实只要会用剪辑软件,生成一个数字人就是分分钟的事。

从图上可以看出,这完全就是在线版的剪辑软件。所有的内容,从文本、视频、背景、语音、字幕,再到素材、工具,几乎和剪辑软件没有区别。
这是之前在刷短视频时看到某位作者用数字人制作的内容,当时觉得很有趣就把它给下载下来了(这里面出现的数字人,正是腾讯智影的小天,可能她是免费的吧😄)。
而进入到2024,数字人技术已经在AI的加持下,前进了一大步。
腾讯推出的MuseTalk是一款实时高质量的唇形同步模型。它可以通过输入一段音频,让视频中的人物保持嘴型同步。它可以与MuseV搭配使用。
下面是我用MuseTalk、spleeter和剪映混搭制做的嘴型同步视频:
根据音频来调整视频嘴型。


上面图片显示的视频怎么生成都报错,只好随便又换了一个,居然成功了😢,但是很模糊。
因为硬件配置的关系,MuseV也跑不起来,有些遗憾。不过它的使用也非常简单,照着官网的示例就能做出来。
类似于MuseTalk的,还有SyncTalk、DreamTalk和AniPortrait。
这些工具已经越来越简单了,按照官方的示例,可以轻松地完成示例。
感谢支持
更多内容,请移步《超级个体》。