基于RAG构建法律条文助手,llamaindex框架,自定义数据划分方式,分为基础搭建,重排序优化,性能优化几个步骤。
大模型应用系列(十九) 大模型RAG项目实战:法律条文助手--方案与数据
介绍RAG的一般实现流程,如何收集数据,处理数据,以及RAG的常见优化方向。
Transformer注意力机制计算公式解析,自回归解码,KV-cache
推导Transformer注意力机制的计算过程,解释训练和推理过程注意力计算的不同,解释为什么有kv-cache而没有q-cache
大模型应用系列(十八) 大模型RAG项目实战:本地部署Dify实现RAG
介绍如何在Ubuntu22.04服务器上部署Dify并集成本地部署大模型,也介绍了较为简单的Windows部署方式,同时提供示例在Dify平台上快速搭建RAG。
大模型应用系列(十七) 大模型RAG项目实战:Llamaindex文档切分与重排序
介绍RAG中常用的文档切分方式,如何提升召回率,以及简要介绍重排序。
大模型应用系列(十六) 大模型RAG项目实战:Embedding model 模型介绍与选型
简要介绍Embedding Models以及如何根据数据集选择合适的嵌入模型。
大模型应用系列(十五) 大模型RAG项目实战:Chroma 向量数据库介绍与使用
介绍Chroma的原理以及使用方式,说明使用过程中需要注意的问题。
大模型应用系列(十四) 大模型RAG项目实战:Llamainindex 快速构建RAG
介绍LlamaIndex的安装以及如何使用LlamaIndex快速搭建RAG应用。
大模型应用系列(十三) 大模型微调项目实战:情绪对话模型
微调项目实战:微调一个情绪对话模型,分为数据集构建,模型选型,微调,部署, 开发五个阶段。
大模型应用系列(十二) 大模型评估,openCompass的安装和使用
简单介绍大模型评估常用的指标和数据集,以及评估工具opencompass的安装和使用。