ComfyUI视频剪辑界面
类似于视频编辑工具的时间线界面,可以快捷添加、删除或重新排列内容
一个语音转换工具,可以将文字转换为语音,并用OSC消息发送到VRChat上的头像显示。
一个使用GPT模型来控制浏览器的工具。它通过接受自然语言命令,实现了用人类方式与浏览器进行交互的功能。
基于U-Net架构,并通过将扩散过程与传统的卷积神经网络相结合,提供了更好的图像分割结果
展示了开源语音AI在各种设备中的威力
千问官方提供的Agent开发框架,可以实现指令遵循、工具使用、规划、记忆能力。
一个强大的 npm 包,它提供了一个在线浏览器中使用的抠图脚本