跟阿里的Emo、微软的VASA-1类似,能通过语音驱动,使用图片生成带有表情和头部动作的视频。
跟阿里的Emo、微软的VASA-1类似,能通过语音驱动,使用图片生成带有表情和头部动作的视频。后续会开源代码和模型。
一款功能强大且易于使用的音频分离工具,可以根据你的描述准确分离音频文件中的不同声音源。
跨平台的桌面应用,在一个界面里面集成了多个 AI 网站,支持复用提示,以及同时向多款 AI 提问
上传图片即可生成贴纸的开源模型
一种分层自适应零样本语音风格转换模型
一键免费部署私人 ChatGPT+Midjourney 网页应用 支持原ChatGPT-Next-Web所有功能 还额外支持AI绘图、图片放大、识图、 混图、垫图等等功能
一句话生成 3D 模型