通过提炼二维扩散来学习有关节的三维动物,用于视频游戏等实时应用
牛津大学的研究人员提出了Farm3D:一个人工智能框架,可以通过提炼二维扩散来学习有关节的三维动物,用于视频游戏等实时应用
在文本输入的同时立即开始语音合成,无需等待整个文本输入完毕。
一款专业的人物肖像提示词生成工具
一个开源工具包,可实现语音、声音和歌唱功能
一个用于图像和视频修复的应用程序,它使用ESRGAN模型进行训练,该模型使用合成数据进行图像和视频的恢复
一种强大的文本生成音频模型,具有声音克隆和多种语音合成应用方面的功能。通过使用该模型,您可以生成高质量、个性化的音频内容
一个开源项目,它可以实现 API 形式的调用 AI 绘图。