Domain-Driven LLM Development: Insights into RAG and Fine-Tuning Practices

计算机科学 领域(数学分析) 数学 数学分析
作者
J.C. Santos,Rachel Hu,Richard Song,Yunfei Bai
标识
DOI:10.1145/3637528.3671445
摘要

To improve Large Language Model (LLM) performance on domain specific applications, ML developers often leverage Retrieval Augmented Generation (RAG) and LLM Fine-Tuning. RAG extends the capabilities of LLMs to specific domains or an organization's internal knowledge base, without the need to retrain the model. On the other hand, Fine-Tuning approach updates LLM weights with domain-specific data to improve performance on specific tasks. The fine-tuned model is particularly effective to systematically learn new comprehensive knowledge in a specific domain that is not covered by the LLM pre-training. This tutorial walks through the RAG and Fine-Tuning techniques, discusses the insights of their advantages and limitations, and provides best practices of adopting the methodologies for the LLM tasks and use cases. The hands-on labs demonstrate the advanced techniques to optimize the RAG and fine-tuned LLM architecture that handles domain specific LLM tasks. The labs in the tutorial are designed by using a set of open-source python libraries to implement the RAG and fine-tuned LLM architecture.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
lyp发布了新的文献求助10
6秒前
浅色西完成签到,获得积分10
6秒前
喜悦的千万完成签到 ,获得积分10
10秒前
21秒前
老迟到的小蘑菇完成签到,获得积分10
24秒前
25秒前
Stringgggg完成签到,获得积分10
26秒前
lyp发布了新的文献求助10
26秒前
xiangxing发布了新的文献求助10
30秒前
过时的奇迹应助12345采纳,获得20
33秒前
33秒前
36秒前
37秒前
优雅含灵完成签到,获得积分10
40秒前
火火火完成签到,获得积分10
40秒前
41秒前
卓梨发布了新的文献求助10
41秒前
zy发布了新的文献求助10
41秒前
猪猪猪发布了新的文献求助10
41秒前
Felix完成签到 ,获得积分10
42秒前
ZZ完成签到,获得积分10
43秒前
君君发布了新的文献求助10
44秒前
慕青应助苏小小采纳,获得10
44秒前
xiangxing发布了新的文献求助10
45秒前
49秒前
啦啦啦啦啦完成签到,获得积分10
51秒前
猪猪猪发布了新的文献求助10
52秒前
53秒前
科研通AI2S应助xiangxing采纳,获得10
54秒前
57秒前
57秒前
57秒前
57秒前
58秒前
58秒前
qiao应助小王要努力采纳,获得10
58秒前
58秒前
58秒前
58秒前
59秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
ISCN 2024 – An International System for Human Cytogenomic Nomenclature (2024) 3000
Continuum Thermodynamics and Material Modelling 2000
Encyclopedia of Geology (2nd Edition) 2000
105th Edition CRC Handbook of Chemistry and Physics 1600
T/CAB 0344-2024 重组人源化胶原蛋白内毒素去除方法 1000
Maneuvering of a Damaged Navy Combatant 650
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3775571
求助须知:如何正确求助?哪些是违规求助? 3321201
关于积分的说明 10203945
捐赠科研通 3036025
什么是DOI,文献DOI怎么找? 1665907
邀请新用户注册赠送积分活动 797196
科研通“疑难数据库(出版商)”最低求助积分说明 757766