⌕

← 返回 | 首页

LLaMA Factory：高效的大模型微调框架

项目简介

LLaMA Factory 是一个专注于大语言模型高效微调的开源框架。它支持 LLaMA、Qwen、Mistral、ChatGLM 等几乎所有主流开源大模型的参数高效微调。通过封装 LoRA、QLoRA、AdaLoRA 等主流微调算法，使得用户无需深入了解底层实现即可对模型进行高效微调。

基本信息

项目	数据
GitHub	https://github.com/hiyouga/LlamaFactory
Star 数	72,098
编程语言	Python
分类	AI 框架
作者	hiyouga
创建时间	2023-05-28
最近更新	2026-06-10

功能介绍

核心功能

多种微调算法：内置 LoRA、QLoRA、AdaLoRA、DoRA 等 10+ 种参数高效微调方法
广泛模型支持：兼容 100+ 种主流开源模型，包括 LLaMA、Qwen、DeepSeek 等系列
统一训练接口：提供标准化的训练脚本和配置文件，简化微调流程

应用场景

领域模型定制：在医疗、法律、金融等垂直领域微调通用模型
指令微调优化：使用高质量指令数据集微调模型，提升对话和任务执行能力
低成本模型训练：在消费级 GPU 上即可完成模型微调，降低 AI 开发门槛

优势特点

极低学习成本：提供详细的配置模板，初学者也能快速上手
训练效率优化：通过梯度检查点、混合精度等技术大幅减少显存占用
完整实验管理：支持训练日志记录、模型断点续训和结果对比分析

数据来源： GitHub - https://github.com/hiyouga/LlamaFactory 发布时间： 2026-06-12 作者： hiyouga 原文链接： https://github.com/hiyouga/LlamaFactory

← 返回 ← 首页