专门用于生成 SQL 语句的模型
一种实用性极强的即时仿声技术,只需要使用来自目标发言人的短音频,就可以模仿他们的声音,并以此生成各种语言的语音
一个功能强大且易于使用的界面,使用户可以轻松地与各种LLM进行交互,并提供了全面的功能来增强交互体验,包括多模型支持、音频交互、多模态支持等
一个开源的2D和3D深度人脸分析库
一个基于隐式空间的图像超分辨率算法,图像超分辨率任务的目标是将低分辨率图像转换为对应的高分辨率图像
一个可以自己托管的 Whisper 解决方案,服务端是 Python,客户端是 JS,基于 WebSocket 实时通信,可以做到语音的实时传输和文本转换。
无需训练LoRA,保持人脸一致,生成多种风格的肖像