亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Exploring the MIT Mathematics and EECS Curriculum Using Large Language Models

刻度(仪器) 课程 集合(抽象数据类型) 计算机科学 数学教育 嵌入 科学与工程 人工智能 数学 工程类 程序设计语言 教育学 心理学 几何学 工程伦理学
作者
Sarah Zhang,Samuel Florin,Ariel N. Lee,Eamon Niknafs,Andrei Marginean,Annie Wang,Keith Tyser,Zad Chin,Yann Hicke,Nikhil Singh,Madeleine Udell,Yoon Kim,Tonio Buonassisi,Armando Solar-Lezama,Iddo Drori
出处
期刊:Cornell University - arXiv 被引量:11
标识
DOI:10.48550/arxiv.2306.08997
摘要

We curate a comprehensive dataset of 4,550 questions and solutions from problem sets, midterm exams, and final exams across all MIT Mathematics and Electrical Engineering and Computer Science (EECS) courses required for obtaining a degree. We evaluate the ability of large language models to fulfill the graduation requirements for any MIT major in Mathematics and EECS. Our results demonstrate that GPT-3.5 successfully solves a third of the entire MIT curriculum, while GPT-4, with prompt engineering, achieves a perfect solve rate on a test set excluding questions based on images. We fine-tune an open-source large language model on this dataset. We employ GPT-4 to automatically grade model responses, providing a detailed performance breakdown by course, question, and answer type. By embedding questions in a low-dimensional space, we explore the relationships between questions, topics, and classes and discover which questions and classes are required for solving other questions and classes through few-shot learning. Our analysis offers valuable insights into course prerequisites and curriculum design, highlighting language models' potential for learning and improving Mathematics and EECS education.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
雨天爱吃冰淇淋完成签到 ,获得积分10
19秒前
在水一方应助壮壮采纳,获得10
19秒前
大个应助无糖零脂采纳,获得10
34秒前
36秒前
壮壮发布了新的文献求助10
41秒前
未青易完成签到 ,获得积分10
42秒前
54秒前
明理丹烟应助科研通管家采纳,获得10
59秒前
科研通AI2S应助科研通管家采纳,获得10
59秒前
NexusExplorer应助科研通管家采纳,获得10
59秒前
科研通AI2S应助科研通管家采纳,获得10
1分钟前
明理丹烟应助科研通管家采纳,获得10
1分钟前
英姑应助科研通管家采纳,获得10
1分钟前
汉堡包应助科研通管家采纳,获得10
1分钟前
科研通AI2S应助qqq采纳,获得10
1分钟前
小马日常挨打完成签到 ,获得积分10
1分钟前
苏航完成签到,获得积分20
2分钟前
qqq完成签到,获得积分10
2分钟前
2分钟前
qqq发布了新的文献求助10
2分钟前
钰姝完成签到,获得积分20
2分钟前
苏航发布了新的文献求助10
2分钟前
思源应助Cassel采纳,获得10
2分钟前
小蘑菇应助Chloe采纳,获得10
2分钟前
端庄的访枫完成签到 ,获得积分10
2分钟前
SciGPT应助ylky采纳,获得50
2分钟前
可爱的函函应助Jing采纳,获得10
3分钟前
3分钟前
科研通AI2S应助科研通管家采纳,获得10
3分钟前
天天快乐应助MoonFlows采纳,获得10
3分钟前
3分钟前
rengar完成签到,获得积分10
3分钟前
panx驳回了bkagyin应助
3分钟前
3分钟前
Cassel发布了新的文献求助10
3分钟前
Sandy完成签到 ,获得积分10
3分钟前
panx给panx的求助进行了留言
3分钟前
4分钟前
云猫完成签到 ,获得积分10
4分钟前
MoonFlows发布了新的文献求助10
4分钟前
高分求助中
中国国际图书贸易总公司40周年纪念文集 大事记1949-1987 2000
TM 5-855-1(Fundamentals of protective design for conventional weapons) 1000
草地生态学 880
Threaded Harmony: A Sustainable Approach to Fashion 799
Basic Modern Theory of Linear Complex Analytic 𝑞-Difference Equations 510
中国有机(类)肥料 500
Queer Politics in Times of New Authoritarianisms: Popular Culture in South Asia 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 基因 遗传学 催化作用 物理化学 免疫学 量子力学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 3059518
求助须知:如何正确求助?哪些是违规求助? 2715495
关于积分的说明 7445189
捐赠科研通 2361002
什么是DOI,文献DOI怎么找? 1251087
科研通“疑难数据库(出版商)”最低求助积分说明 607698
版权声明 596448