能用图像识别+音频转文字把视频生成长文档,再对文档进行提问、对话。
用Wisper获取音频的字幕
音频转文字
提供语音和视频转文字服务。该工具能自动识别讲话人音色,分享会等内容整理成文字,方便用户在工作中快速查阅和整理信息。飞书妙记是一款实用的办公神器。
一个开源、可扩展的高性能聊天机器人框架,支持一键部署私有ChatGPT/LLM Web应用程序
一个功能强大且灵活的文本到图像生成工具,它能够根据用户的自然语言描述和几何布局信息生成高质量的图像。
一个易于使用的自定义工作流引擎系统