Skip to content

资源导航

数据集

  • 通用语料:Pile、RefinedWeb、C4;中文可选 Wudao/ClueCorpus(注意授权)。
  • 指令/对话:ShareGPT、UltraChat、OpenOrca、自制垂类指令集合。
  • 安全与拒答:PKU SafeRLHF、Beavertails、AlignBench-Safety。

评测基准

  • 通用理解:MMLU、C-Eval、AGIEval。
  • 推理:GSM8K、MATH、MMLU-Pro。
  • 代码:HumanEval、MBPP、CodeBLEU 相关任务。
  • 安全:ToxiGen、RealToxicityPrompts,及红队自建集合。

工具与框架

  • 训练/微调:PyTorch、DeepSpeed、Lightning、vLLM-LoRA。
  • 推理/服务:vLLM、TensorRT-LLM、TGI;监控可选 Prometheus/Grafana。
  • 代理与编排:LangChain、LlamaIndex、OpenAI ReAct/Functions、LLM-as-Observer 模式。

开源模型

  • 通用:Llama 2/3、Mistral/Mixtral、Qwen、GLM。
  • 代码:CodeLlama、StarCoder、DeepSeek-Coder。
  • 多模态:Qwen-VL、LLaVA、InternVL。

选择资源前请确认许可证与数据合规性,避免侵权与敏感内容风险。

本网站由 gpt-5.1-codex 构建