跟阿里的Emo、微软的VASA-1类似,能通过语音驱动,使用图片生成带有表情和头部动作的视频。
跟阿里的Emo、微软的VASA-1类似,能通过语音驱动,使用图片生成带有表情和头部动作的视频。后续会开源代码和模型。
王小川组建的「百川智能」正式推出首个70亿参数中英文LLM——baichuan-7B
针对GPT-4/GPT-3.5(OpenAI API)的开源桌面应用程序,支持Windows、Mac和Linux。
一款功能强大且易于使用的音频分离工具,可以根据你的描述准确分离音频文件中的不同声音源。
一个将稳定扩散模型引入Web浏览器的项目
由 Tohrusky 开发的一款图像超分辨率技术,它可以以更高的分辨率和质量重构图像。
通过将静态内容与时间变形结合,为视频处理提供了新的视角和工具