ChainForge

ChainForge是一个开源的可视化编程环境，旨在为大型语言模型(LLMs)的提示(prompt)设计和测试提供实验场所。这个环境支持对提示方案进行快速地探索和质量评估，适用于早期、快速、实验性的提示探索场景。以下是对其功能、使用场景及使用方法的详细介绍：

支持多模型查询：您可以同时查询多个LLM以快速测试提示方案及其变体。
跨模型与提示变量的响应质量比较：使用户能够比较不同提示方案、模型及模型设置下的响应质量，以选出最佳的提示方案和模型。
设置评估指标：用户可以设置评估指标（评分函数），并立即在各种提示、参数、模型及模型设置下可视化结果。
模板化多轮对话：支持对话模板化，让用户可以在多轮对话中检查和评估输出。
支持主流模型提供商：包括OpenAI、HuggingFace、Anthropic、Google PaLM2、Azure OpenAI端点，以及Dalai托管的Alpaca和Llama模型等。
丰富的示例评估流：提供了从OpenAI评估中生成的188个示例流，帮助用户快速入门和探索。

安装：需要Python 3.8或更高版本。通过运行命令 pip install chainforge 安装ChainForge。
启动服务：安装完后，运行 chainforge serve 并在支持的浏览器（Google Chrome, Firefox, Microsoft Edge, 或 Brave）中打开 localhost:8000 地址。
设置API密钥：在界面右上角点击设置图标，设置您的OpenAI、Anthropic和/或Google PaLM API密钥。
选择或创建流程：点击“示例流程”按钮选择一个流程开始探索，或者创建新的流程以实现您的需求。
分享与反馈：在Web版本下，您也可以通过点击“分享”按钮生成流程的唯一链接，并与他人共享您的流程。