识别视频中的人物的面部和身体动作,为后续的SD绘图提供支持
DWPose:用于检测视频中人物的动作
该系统基于MMPose和ControlNet,能够识别视频中的人物的面部和身体动作,为后续的SD绘图提供支持。
一种分层自适应零样本语音风格转换模型
一个可以将自己的照片上传并生成数字孪生的应用程序
把视频中的人物替换成3D模型
一个用于音频处理和生成的深度学习库
输入图片,按文字描述调整光照效果;输入图片+光照参考,按参考图生成光照效果。
一种实用性极强的即时仿声技术,只需要使用来自目标发言人的短音频,就可以模仿他们的声音,并以此生成各种语言的语音