乌漆嘛黑

大模型应用系列(十一) LMDeploy量化部署

发表于 2025-04-11 更新于 2025-04-14 分类于大模型应用，评估与部署

介绍量化的概念，使用lmdeploy进行模型量化与kv-cache量化部署。

发表于 2025-04-08 更新于 2025-04-12 分类于大模型应用，训练与微调

介绍DeepSeep框架，使用LLamaFactory和XTuner进行分布式微调。同时介绍XTuner的安装和使用，以及XTuner如何进行模型转换与合并。

发表于 2025-03-30 更新于 2025-06-07 分类于大模型应用，评估与部署

解决在微调和部署时对话模板不统一的问题。

发表于 2025-03-30 更新于 2025-04-08 分类于大模型应用，训练与微调

LoRA与QLoRA的异同，以及如何在LLamaFactory上使用LoRA与QLoRA

发表于 2025-03-30 更新于 2025-04-08 分类于大模型应用，训练与微调

详细介绍了LLamaFactory和OpenWebui的安装和使用, 以及如何在LLamaFactory上进行推理，微调。以及如何通过脚本对模型进行Lora微调。最后解释量化原理。

发表于 2025-03-30 分类于大模型应用，概念和原理

介绍如何根据模型的参数量计算显存占用，介绍了分布式训练常见的通信原语，包括Reduce, Gather, Broadcast,Scatter,ReduceScatter,AllGather,AllReduce等，以及介绍Zero优化器三个级别各自的执行过程。

发表于 2025-03-21 更新于 2025-06-23 分类于大模型应用，评估与部署

介绍如何从modelscope下载模型，以及三种常用的本地模型部署工具 ollama，vllm, LMDeploy 的下载，部署和调用方法。

发表于 2025-03-17 更新于 2025-04-08 分类于大模型应用，训练与微调

本地连接云服务器，在云服务器上训练模型，通过后处理控制模型的输出。

发表于 2025-03-13 更新于 2025-04-08 分类于大模型应用，训练与微调

在古诗词数据集上微调GPT2，介绍了如何调用GPT，如何制作数据集，以及如何微调。

发表于 2025-03-12 更新于 2025-04-08 分类于大模型应用，训练与微调

在二分类问题上微调Bert模型，介绍AI项目的开发流程，包括数据，模型，微调，评估，部署，以及介绍开发过程中细节，并给出各个步骤的代码。