支持文字生成视频和图片生成视频。
开放扩散模型用于高质量视频生成。
一个多语言文档OCR工具包,能够实现准确的逐行文本检测和识别。
一款适用于搭建内部培训平台的开源系统,旨在为企业/机构打造自己品牌的内部培训平台
展示了开源语音AI在各种设备中的威力
能生成与原图风格融为一体的文字,或者对原图中的文字进行修改,并且还能支持中文!
一款视频、音频和图像转换软件,基于FFmpeg和其他优秀工具设计,旨在尽可能方便和高效
全文本搜索引擎库