Appearance
资源导航
数据集
- 通用语料:Pile、RefinedWeb、C4;中文可选 Wudao/ClueCorpus(注意授权)。
- 指令/对话:ShareGPT、UltraChat、OpenOrca、自制垂类指令集合。
- 安全与拒答:PKU SafeRLHF、Beavertails、AlignBench-Safety。
评测基准
- 通用理解:MMLU、C-Eval、AGIEval。
- 推理:GSM8K、MATH、MMLU-Pro。
- 代码:HumanEval、MBPP、CodeBLEU 相关任务。
- 安全:ToxiGen、RealToxicityPrompts,及红队自建集合。
工具与框架
- 训练/微调:PyTorch、DeepSpeed、Lightning、vLLM-LoRA。
- 推理/服务:vLLM、TensorRT-LLM、TGI;监控可选 Prometheus/Grafana。
- 代理与编排:LangChain、LlamaIndex、OpenAI ReAct/Functions、LLM-as-Observer 模式。
开源模型
- 通用:Llama 2/3、Mistral/Mixtral、Qwen、GLM。
- 代码:CodeLlama、StarCoder、DeepSeek-Coder。
- 多模态:Qwen-VL、LLaVA、InternVL。
选择资源前请确认许可证与数据合规性,避免侵权与敏感内容风险。