一个开源工具包,可实现语音、声音和歌唱功能
Amphion是一个开源工具包,可实现语音、声音和歌唱功能。除了文字转语音功能,它还能将一首歌的声音换成另一个歌手的声音,并支持声音转换、歌声合成、文本到音频、文本到音乐等功能。
一款开源且完全本地化的AI搜索工具,无需依赖OpenAI或Google的API密钥
多语言视觉文本生成和编辑工具,它基于扩散模型,能够在图片中生成或编辑文字
识别视频中的人物的面部和身体动作,为后续的SD绘图提供支持
免费开源的AI画质提升、无损放大图片工具
一个平民版视频翻译工具,音频翻译,翻译校正,视频唇纹合成全流程解决方案
一个第三方开源工具,用于调用LLM,实现文档语义对话