baichuan-7B

Baichuan-7B是由王小川团队开发的百川大规模预训练语言模型。该模型基于Transformer结构，在1.2万亿tokens上训练了70亿参数的模型，支持中英双语，上下文窗口长度为4096。

原始训练数据包括开源的中英文数据和自行抓取的中文互联网数据，以及部分高质量知识性数据，总量超过10T。数据处理环节重点考虑了频率和质量两个维度。使用启发式规则和质量模型打分对原始数据集进行篇章和句子粒度的过滤。在全量数据上，利用局部敏感哈希方法对篇章和句子粒度进行滤重。

该模型的推理代码已经提供在官方Huggingface库中，可直接使用。此外，训练方法也在GitHub仓库中有详细的说明，包括安装依赖、准备数据、配置DeepSpeed和执行训练等步骤。

相关导航

基于私有LLM（大语言模型）做个人的文档问答

一个OpenAI接口管理和分发系统，它支持多个不同的人工智能模型，包括Azure、Anthropic Claude、Google PaLM 2、智谱ChatGLM、百度文心一言、讯飞星火认知、阿里通义千问以及360智脑

识别视频中的人物的面部和身体动作，为后续的SD绘图提供支持

精细的边缘检测ControlNet

Mac 上的一个多模态 AI 助手，能支持语音和截图，借助 GPT-4V 的多模态能力，可以基于当前屏幕截图和指令可以回复问题。

主要用于数据分析领域，可以将用户需求转换为可执行代码

暂无评论...