Large Language Models Can Self-Improve

一致性(知识库) 计算机科学 基本事实 语言模型 人工智能 自然语言处理 机器学习
作者
Jiaxin Huang,Shixiang Gu,Le Hou,Yuexin Wu,Xuezhi Wang,Hongkun Yu,Jiawei Han
出处
期刊:Cornell University - arXiv 被引量:15
标识
DOI:10.48550/arxiv.2210.11610
摘要

Large Language Models (LLMs) have achieved excellent performances in various tasks. However, fine-tuning an LLM requires extensive supervision. Human, on the other hand, may improve their reasoning abilities by self-thinking without external inputs. In this work, we demonstrate that an LLM is also capable of self-improving with only unlabeled datasets. We use a pre-trained LLM to generate "high-confidence" rationale-augmented answers for unlabeled questions using Chain-of-Thought prompting and self-consistency, and fine-tune the LLM using those self-generated solutions as target outputs. We show that our approach improves the general reasoning ability of a 540B-parameter LLM (74.4%->82.1% on GSM8K, 78.2%->83.0% on DROP, 90.0%->94.4% on OpenBookQA, and 63.4%->67.9% on ANLI-A3) and achieves state-of-the-art-level performance, without any ground truth label. We conduct ablation studies and show that fine-tuning on reasoning is critical for self-improvement.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
小马甲应助科研通管家采纳,获得10
刚刚
科研通AI2S应助科研通管家采纳,获得10
刚刚
赘婿应助科研通管家采纳,获得10
刚刚
华仔应助科研通管家采纳,获得10
刚刚
小小牛发布了新的文献求助10
刚刚
刚刚
刚刚
刚刚
胖头锦鲤发布了新的文献求助10
1秒前
三重积分咖啡完成签到 ,获得积分10
1秒前
北葵向暖完成签到,获得积分10
2秒前
2秒前
4秒前
4秒前
完美世界应助YANGxuxuxu采纳,获得10
6秒前
6秒前
糊涂的雁易应助大方博涛采纳,获得10
6秒前
aaaaaa完成签到,获得积分10
7秒前
爱听歌靳发布了新的文献求助400
8秒前
cj关闭了cj文献求助
9秒前
HHHH发布了新的文献求助10
10秒前
飘逸元灵完成签到,获得积分10
11秒前
akmdh完成签到,获得积分10
12秒前
12秒前
14秒前
16秒前
YANGxuxuxu发布了新的文献求助10
17秒前
NexusExplorer应助野性的南蕾采纳,获得10
17秒前
桐桐应助HHHH采纳,获得10
17秒前
大模型应助shawn采纳,获得10
18秒前
ZH完成签到,获得积分10
18秒前
20秒前
搜集达人应助.123666采纳,获得10
20秒前
20秒前
叫我魔王大人完成签到,获得积分10
20秒前
20秒前
saluo发布了新的文献求助10
22秒前
23秒前
斯文谷秋发布了新的文献求助10
23秒前
23秒前
高分求助中
rhetoric, logic and argumentation: a guide to student writers 1000
QMS18Ed2 | process management. 2nd ed 1000
One Man Talking: Selected Essays of Shao Xunmei, 1929–1939 1000
A Chronicle of Small Beer: The Memoirs of Nan Green 1000
From Rural China to the Ivy League: Reminiscences of Transformations in Modern Chinese History 900
Eric Dunning and the Sociology of Sport 850
The Cambridge Introduction to Intercultural Communication 700
热门求助领域 (近24小时)
化学 医学 材料科学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 物理化学 催化作用 免疫学 细胞生物学 电极
热门帖子
关注 科研通微信公众号,转发送积分 2916547
求助须知:如何正确求助?哪些是违规求助? 2557126
关于积分的说明 6916523
捐赠科研通 2217141
什么是DOI,文献DOI怎么找? 1178458
版权声明 588403
科研通“疑难数据库(出版商)”最低求助积分说明 576742