一个用于音频处理和生成的深度学习库
Audiocraft是一个用于音频处理和生成的深度学习库。它具有最先进的EnCodec音频压缩器/标记器,以及MusicGen,一个简单和可控的音乐生成LM,具有文本和旋律调节功能。
一个音乐播放器,旨在帮助用户进入“心流”状态。它提供了环境音乐生成器,可以帮助用户集中注意力。该网站提供了许多免费的音轨,可以帮助用户进入心流状态,并设计了许多功能来帮助用户保持在这种状态下。
一种用于构建人工智能代理的反应式运行时
无需训练LoRA,保持人脸一致,生成多种风格的肖像
一个开源工具包,可实现语音、声音和歌唱功能
由清华大学交叉信息科学研究院研发的一款生成模型。它的特点是可以通过少量步骤推理合成高分辨率图像,使图像生成速度提升 2-5 倍,需要的算力也更少。
能用图像识别+音频转文字把视频生成长文档,再对文档进行提问、对话。