Exploring the MIT Mathematics and EECS Curriculum Using Large Language Models

刻度(仪器) 课程 集合(抽象数据类型) 计算机科学 数学教育 嵌入 科学与工程 人工智能 数学 工程类 程序设计语言 教育学 心理学 几何学 工程伦理学
作者
Sarah Zhang,Samuel Florin,Ariel N. Lee,Eamon Niknafs,Andrei Marginean,Annie Wang,Keith Tyser,Zad Chin,Yann Hicke,Nikhil Singh,Madeleine Udell,Yoon Kim,Tonio Buonassisi,Armando Solar-Lezama,Iddo Drori
出处
期刊:Cornell University - arXiv 被引量:11
标识
DOI:10.48550/arxiv.2306.08997
摘要

We curate a comprehensive dataset of 4,550 questions and solutions from problem sets, midterm exams, and final exams across all MIT Mathematics and Electrical Engineering and Computer Science (EECS) courses required for obtaining a degree. We evaluate the ability of large language models to fulfill the graduation requirements for any MIT major in Mathematics and EECS. Our results demonstrate that GPT-3.5 successfully solves a third of the entire MIT curriculum, while GPT-4, with prompt engineering, achieves a perfect solve rate on a test set excluding questions based on images. We fine-tune an open-source large language model on this dataset. We employ GPT-4 to automatically grade model responses, providing a detailed performance breakdown by course, question, and answer type. By embedding questions in a low-dimensional space, we explore the relationships between questions, topics, and classes and discover which questions and classes are required for solving other questions and classes through few-shot learning. Our analysis offers valuable insights into course prerequisites and curriculum design, highlighting language models' potential for learning and improving Mathematics and EECS education.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
TTK完成签到,获得积分20
2秒前
迷人的焦完成签到 ,获得积分10
3秒前
acat完成签到 ,获得积分10
3秒前
小花生完成签到 ,获得积分10
8秒前
SCI的芷蝶完成签到 ,获得积分10
17秒前
19秒前
九花青完成签到,获得积分10
27秒前
LN完成签到,获得积分10
32秒前
506407完成签到,获得积分10
43秒前
丝丢皮的完成签到 ,获得积分10
46秒前
小羊咩完成签到,获得积分0
51秒前
丝丢皮得完成签到 ,获得积分10
53秒前
麦田麦兜完成签到,获得积分10
57秒前
www完成签到 ,获得积分10
1分钟前
喵了个咪完成签到 ,获得积分10
1分钟前
ada阿达完成签到,获得积分10
1分钟前
Moto_Fang完成签到 ,获得积分10
1分钟前
tfonda完成签到 ,获得积分10
1分钟前
沐阳完成签到 ,获得积分10
1分钟前
打打应助erhou666采纳,获得10
1分钟前
思源应助erhou666采纳,获得10
1分钟前
星辰大海应助erhou666采纳,获得10
1分钟前
慕青应助erhou666采纳,获得10
1分钟前
今后应助erhou666采纳,获得20
1分钟前
星辰大海应助erhou666采纳,获得20
1分钟前
斯文败类应助erhou666采纳,获得10
1分钟前
CipherSage应助erhou666采纳,获得10
1分钟前
顾矜应助erhou666采纳,获得20
1分钟前
共享精神应助erhou666采纳,获得10
1分钟前
吕佳丽完成签到,获得积分10
1分钟前
yaonuliwa完成签到 ,获得积分10
1分钟前
碗碗豆喵完成签到 ,获得积分10
1分钟前
JUN完成签到,获得积分10
1分钟前
ll完成签到,获得积分10
1分钟前
瞿人雄完成签到,获得积分10
1分钟前
没心没肺完成签到,获得积分10
1分钟前
学术霸王完成签到,获得积分10
1分钟前
奈思完成签到 ,获得积分10
1分钟前
lambs13完成签到,获得积分10
1分钟前
mark完成签到,获得积分10
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Developing Genetic Editing Tools for Lysobacter 2000
卤化钙钛矿人工突触的研究 2000
Моделирование процессов самоорганизации в кристаллообразующих системах 1000
History of U.S. Space Surveillance and Satellite Cataloging 1000
Malcolm Fraser : a biography 700
Signals, Systems, and Signal Processing 610
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6515653
求助须知:如何正确求助?哪些是违规求助? 8308719
关于积分的说明 17757469
捐赠科研通 5617624
什么是DOI,文献DOI怎么找? 2925117
邀请新用户注册赠送积分活动 1902093
关于科研通互助平台的介绍 1763452