一个开源工具包,可实现语音、声音和歌唱功能
Amphion是一个开源工具包,可实现语音、声音和歌唱功能。除了文字转语音功能,它还能将一首歌的声音换成另一个歌手的声音,并支持声音转换、歌声合成、文本到音频、文本到音乐等功能。
能用图像识别+音频转文字把视频生成长文档,再对文档进行提问、对话。
一款专业的人物肖像提示词生成工具
一个开源的 Chatbot 管理服务,可以在管理台中创建基于 Prompt 还是 Embedding 的 Chat 服务,Embedding 可以支持 PDF 和网页文档
一款应用程序,一次提问发多个大模型看结果,支持几乎市面上所有大模型
一个可以自己托管的 Whisper 解决方案,服务端是 Python,客户端是 JS,基于 WebSocket 实时通信,可以做到语音的实时传输和文本转换。
一个功能强大且易于使用的界面,使用户可以轻松地与各种LLM进行交互,并提供了全面的功能来增强交互体验,包括多模型支持、音频交互、多模态支持等