项目结构迁移
技能简介该技能专注于项目结构的规范化治理,能够为新项目快速搭...
HQQ突破传统量化对校准数据的依赖,通过数学优化实现极速压缩流程,在保持模型精度的同时大幅降低显存占用与推理延迟,是边缘部署与大规模服务降本的关键技术方案。
pip install hqq
pip install hqq[torch] # PyTorch backend
hqq-quantization
见下方输入与输出表格。
| 输入 | 输出 |
|---|---|
| 任务目标、输入资料和约束条件;需要处理的平台或对象;结果格式要求 | 结构化结果;执行建议或可交付产物;便于复核的后续说明 |
原始链接:https://github.com/Orchestra-Research/AI-Research-SKILLs
来源类型:GitHub 开源仓库