At检索
连接 tradmangh/at-xpo-windy-mcpserver,用于研究资料检索、聚合与结构化分析。
SimPO是一种简洁高效的LLM对齐训练方法,作为DPO的无参考模型替代方案,在保持更低计算成本的同时取得更优效果。适用于偏好数据充足场景下的模型后训练,简化RLHF流程并提升对齐质量。
conda create -n simpo python=3.10 && conda activate simpo
git clone https://github.com/huggingface/alignment-handbook.git
simpo-training
见下方输入与输出表格。
| 输入 | 输出 |
|---|---|
| 任务目标、输入资料和约束条件;需要处理的平台或对象;结果格式要求 | 结构化结果;执行建议或可交付产物;便于复核的后续说明 |
原始链接:https://github.com/Orchestra-Research/AI-Research-SKILLs
来源类型:GitHub 开源仓库