乌漆嘛黑

大模型应用系列(二十) 大模型RAG项目实战：法律条文助手--实现与部署

发表于 2025-07-25 更新于 2025-08-12 分类于大模型应用，项目实战

基于RAG构建法律条文助手，llamaindex框架，自定义数据划分方式，分为基础搭建，重排序优化，性能优化几个步骤。

发表于 2025-07-25 分类于大模型应用，项目实战

介绍RAG的一般实现流程，如何收集数据，处理数据，以及RAG的常见优化方向。

发表于 2025-06-30 更新于 2025-07-01 分类于大模型应用，概念和原理

推导Transformer注意力机制的计算过程，解释训练和推理过程注意力计算的不同，解释为什么有kv-cache而没有q-cache

发表于 2025-06-30 分类于大模型应用，项目实战

介绍如何在Ubuntu22.04服务器上部署Dify并集成本地部署大模型，也介绍了较为简单的Windows部署方式，同时提供示例在Dify平台上快速搭建RAG。

发表于 2025-06-30 分类于大模型应用，项目实战

介绍RAG中常用的文档切分方式，如何提升召回率，以及简要介绍重排序。

发表于 2025-06-30 分类于大模型应用，项目实战

简要介绍Embedding Models以及如何根据数据集选择合适的嵌入模型。

发表于 2025-06-29 更新于 2025-06-30 分类于大模型应用，项目实战

介绍Chroma的原理以及使用方式，说明使用过程中需要注意的问题。

发表于 2025-06-28 更新于 2025-06-30 分类于大模型应用，项目实战

介绍LlamaIndex的安装以及如何使用LlamaIndex快速搭建RAG应用。

发表于 2025-06-07 更新于 2025-06-10 分类于大模型应用，项目实战

微调项目实战：微调一个情绪对话模型，分为数据集构建，模型选型，微调，部署, 开发五个阶段。

发表于 2025-04-14 分类于大模型应用，评估与部署

简单介绍大模型评估常用的指标和数据集，以及评估工具opencompass的安装和使用。