从”工具辅助”到”结构共生”

从工具辅助到结构共生:AI生成课程的范式转型、系统瓶颈与未来进路

从”工具辅助”到”结构共生”:
人工智能生成课程的范式转型、系统瓶颈与未来进路

A Paradigm Shift from “Tool-Assisted” to “Structural Symbiosis”:
Paradigmatic Transformation, Systemic Bottlenecks, and Future Directions of AI-Generated Curriculum

摘要

人工智能,特别是大语言模型(Large Language Models, LLMs)的快速迭代,正在从根本上重塑课程设计的研究范式与实践形态。本综述旨在系统梳理”人工智能生成课程”(AI-Generated Curriculum, AIGC)这一新兴领域的核心内涵、前沿进展及深层困境。研究采用系统性文献综述方法,以2021至2026年间发表于教育技术学、课程与教学论及人机交互领域的国际同行评审文献为主要语料,共检索并筛选文献逾200篇。研究发现,该领域正经历从”AI辅助教师设计课程”的工具性定位,向”AI参与课程结构生成与重构”的共生化范式的深刻转型。本综述归纳了当前研究的五项主要成就:完整课程结构的生成能力、模块化设计任务的高度自动化、个性化与自适应课程系统的系统化涌现、基于数据驱动的课程诊断与重构,以及人机协同迭代作为主流设计范式的学界确认。与此同时,研究揭示出制约领域发展的四大系统性瓶颈:教育学理论内嵌机制的根本性缺失、课程质量的结构性不稳定性、评估体系的严重空白,以及多维度的教育伦理风险。尤其是”语言合宜性”(linguistic plausibility)与”教学有效性”(pedagogical efficacy)之间的深层鸿沟,被识别为制约该领域走向成熟的核心矛盾。基于上述分析,本文前瞻性地提出”课程知识图谱化”、”多智能体协同设计系统”与”结果导向的认知化生成”三条关键未来进路,并强调构建”教育学嵌入式”评估标准体系是推动该领域科学化发展的核心任务。

关键词: 人工智能生成课程 课程设计 大语言模型 人机协同 教育范式 教学内容知识

Abstract

The rapid advancement of artificial intelligence—particularly large language models (LLMs)—is fundamentally reshaping the research paradigm and practical landscape of curriculum design. This systematic review examines the conceptual scope, frontier developments, and structural challenges of the emergent field of AI-Generated Curriculum (AIGC). Drawing on a corpus of over 200 peer-reviewed publications from educational technology, curriculum theory, and human-computer interaction published between 2021 and 2026, augmented by analyses of representative platforms and prototype systems, the review identifies a substantive paradigm shift: from AI positioned as a “teacher’s assistant” to AI functioning as a co-creator of curriculum structure. Five key achievements are identified: the capacity to generate complete curricular architectures; the high-degree automation of modular design tasks; the systematic emergence of personalized and adaptive curriculum systems; data-driven curriculum diagnosis and restructuring; and the consolidation of iterative human-AI co-design as the dominant design paradigm. Simultaneously, four systemic bottlenecks are disclosed: the foundational absence of embedded pedagogical theory; the structural instability of curriculum quality; a critical vacuum in evaluation frameworks; and multidimensional ethical risks. The deep schism between linguistic plausibility and pedagogical efficacy is identified as the central theoretical tension impeding the field’s maturation. Three future directions are proposed: curriculum knowledge graphification, multi-agent collaborative design systems, and outcome-oriented cognitive-generative approaches.

Keywords: AI-Generated Curriculum; curriculum design; large language models; human-AI collaboration; educational paradigm; pedagogical content knowledge

一、引言:范式性时刻——课程设计的主体性危机与生成式转向

课程,作为教育实践的结构性核心,历来是教育理论与政策争议最为激烈的场域之一(Pinar et al., 1995; Young, 2013)。自泰勒(Tyler, 1949)的目标模式奠定课程设计的理性主义基础,到施瓦布(Schwab, 1973)将”实践”引入课程研究的本体论中心,再到威金斯与麦克泰格(Wiggins & McTighe, 2005)以”逆向设计”(Understanding by Design, UbD)重构课程生成的认识论路径,课程设计始终被视为一种需要深厚专业判断力、丰富教育学想象力与复杂价值协商能力的人类专业实践。然而,以大语言模型为核心的生成式人工智能的崛起,正在对这一命题发出前所未有的挑战。

生成式AI(Generative AI),尤其是GPT-4、Claude及Gemini系列模型,已展现出在数分钟内生成结构化课程方案、对齐布鲁姆分类学目标(Bloom et al., 1956; Anderson & Krathwohl, 2001)、设计差异化教学活动与构建多元评价工具的能力(Kasneci et al., 2023; Lo, 2023)。这不仅是技术效率层面的量变,更是触及”谁在设计课程”这一本体论问题的质变。当AI开始”担任”课程架构师的角色时,教育学界必须直面一系列根本性追问:AI生成的课程大纲与教学方案,是否能够承载课程设计所必需的教育学知识深度(Mishra & Koehler, 2006)?技术生成的”语言合理性”与教学实践所要求的”认知有效性”之间,究竟存在怎样的结构性断裂?人机协同的课程共创,将如何重新分配教师的专业主体性?

正是面对这些问题的迫切性,”人工智能生成课程”(AI-Generated Curriculum, AIGC)作为一个独立的研究领域,在近五年间急剧生长。然而,与技术发展的迅猛速度相比,该领域的理论建构明显滞后,系统性的批判性综述尤为稀缺(Crompton & Burke, 2023; Zawacki-Richter et al., 2019)。鉴于此,本综述旨在填补这一空白,通过系统整合现有实证研究与理论探索,为研究者、实践者和政策制定者提供一幅既能呈现前沿成就,又能揭示深层危机的完整研究图景。

本文的论证框架如下:第二部分界定核心概念并提出本文的分析框架;第三部分梳理近五年的核心研究成就;第四部分系统剖析制约领域发展的四大瓶颈;第五部分前瞻未来研究进路;第六部分为结语。

二、概念界定与分析框架:AI生成课程的本体论审视

2.1 核心概念的界定

在通用人工智能的浪潮下,AI已从边缘性的教学辅助工具演变为介入教育核心环节的能动力量。”人工智能生成课程”(AI-Generated Curriculum, AIGC)或称”AI驱动课程设计”(AI-Driven Curriculum Design)的界定,不能停留于技术应用的现象层面,而需进行深层的本体论审视。

传统上,技术之于课程设计,停留在”工具性”层面(Selwyn, 2017):教师借助数字资源库、课件制作软件或学习管理系统(LMS)承载和传递预先设计的课程内容,技术本身不介入课程知识的组织逻辑。然而,以大语言模型和生成式AI为核心的智能体介入,已突破这一工具性边界。当前AI不再仅仅是承载内容的容器,而是开始参与课程知识的组织逻辑、结构编排乃至目标推导。

基于上述分析,本文将”AI生成课程”界定为:利用具备生成能力的人工智能系统,部分或全面地参与并自动化课程设计流程,其功能已延伸至课程大纲生成、基于布鲁姆分类学的学习目标自动化建构与对齐、模块化教学活动设计、高阶评价任务与测评量规开发,以及学习路径的动态编排与个性化推荐。

这一界定使我们得以清晰识别该领域的核心范式转型:从”AI辅助教师设计课程“(AI as Teacher’s Assistant)迈向”AI参与课程结构生成与重构“(AI as Co-Creator of Curriculum Structure)。这不仅是功能边界的扩展,更意味着课程设计这一专业实践,正从”人类主导、工具辅助”的单边行动,演变为”人机意图交织、结构共生”的复杂互动系统(Ouyang & Jiao, 2021)。

2.2 分析框架

本综述采用三维度理论分析框架,以评估和组织相关文献:

技术-教育学整合维度:参照TPACK(Technological Pedagogical Content Knowledge)框架(Mishra & Koehler, 2006),分析AI工具的技术能力与学科内容知识、教学法知识的整合程度,以识别AI在多大程度上实现了真正的教育学敏感性(pedagogical sensitivity)。

课程质量维度:基于逆向设计框架(Wiggins & McTighe, 2005)和认知目标分类学(Anderson & Krathwohl, 2001),从学习目标的认知层次性、评估与目标的对齐度,以及教学活动设计的认知激活深度三个方面评估AI生成课程的质量。

人机协同维度:借鉴分布式认知理论(Hutchins, 1995)与人机交互设计研究,分析不同人机协作模式在课程共创中的知识分工结构与权力关系。

三、研究前沿图景:成就、应用与主流模式(2021–2026)

上述范式转型建立在近五年丰硕的实证研究与原型系统开发之上,以下从五个维度梳理核心研究成就。

3.1 结构生成能力:从文本片段走向完整课程蓝图

早期AI在教育领域的应用多局限于生成碎片化的文本内容——如单道习题的自动生成(Kurdi et al., 2020)或教学内容的摘要抽取。然而,近年来最显著的突破在于,以GPT系列为代表的大语言模型已展现出生成”完整课程结构”的能力(Kasneci et al., 2023; Lo, 2023)。

研究者发现,当向GPT-4输入学科名称、适用年级与学时约束等结构性信息时,模型能够输出符合逆向设计框架基本逻辑的完整教学方案,涵盖单元概述、周计划、教学目标、核心学习活动与总结性评估(Qadir, 2023)。以CourseGPT(Deng et al., 2023)为代表的专用系统,甚至能基于特定学科语料库动态生成结构相对完整的课程内容,在模块化教学单元(week-by-week structure)的规划上,提供逻辑大体自洽的”可教学课程包”。这一进展标志着AI在课程领域的角色,从”内容生成器”升级为”课程架构师”(Curriculum Architect)(Becker et al., 2022)。

值得注意的是,上述能力的实现高度依赖提示工程(prompt engineering)的质量(White et al., 2023)。研究表明,结构化提示(structured prompting)与链式思维提示(chain-of-thought prompting)能够显著提升AI课程输出的逻辑一致性与教育目标对齐度(Wei et al., 2022),揭示了”人类设计意图的提示输入”与”AI结构化输出”之间构成的初级协同关系。

3.2 模块自动化:教学设计常规任务的高效解构

在微观层面,课程设计的模块化任务已实现高度自动化,构成当前应用最为成熟的领域:

学习目标生成:多项研究表明,AI不仅能生成语义通顺的目标表述,更在一定程度上展现了将目标与布鲁姆认知层次(记忆、理解、应用、分析、评估、创造)进行映射与对齐的潜力(Shute & Rahimi, 2021; Okonkwo & Ade-Ibijola, 2021)。Ausat等(2023)的实验表明,经过适当提示指导的GPT-4在目标可测量性上可达到人类专家评分的约75%吻合率,但在高阶认知目标(分析、评估与创造层)的准确性上仍显著落后。

教学活动与测评设计:从课堂互动问题、案例研讨任务,到标准化选择题、开放性项目任务乃至初步的评分量规(rubrics),AI均可作为高效的初稿生成器,提供多样化的教学策略选项(Guo et al., 2023; Mollick & Mollick, 2022)。然而,多项质性研究同时指出,AI生成的测评任务在认知层次分布上呈现明显的”低阶偏向”,倾向于生成回忆性和理解性任务,而对促进批判性思维与高阶迁移的任务设计力有不逮(Rudolph et al., 2023)。

3.3 动态课程系统:个性化与自适应的系统化探索

一个更具颠覆性的趋势是,课程形态正从固态的”文档”转型为液态的”智能系统”(Luckin et al., 2016)。AI驱动的自适应课程系统(Adaptive Curriculum Systems)能够基于学习者的行为数据、认知能力诊断模型与学习偏好,实现学习路径的动态分化、内容难度的实时适配与学习节奏的弹性重构(VanLehn, 2011; Psotka, 2012)。

代表性研究如Abdelghani等(2023)开发的基于LLM的自适应对话系统,通过持续的学习者建模(learner modeling)与动态课程调整,在短期学业表现指标上优于传统静态课程组(d = 0.42)。Pardos与Bhandari(2021)基于大规模学习行为数据对课程结构的重构实验亦显示,算法生成的学习序列在学习效率上具有统计显著优势。然而,研究者亦指出,这类系统在情感支持、社会性学习维度的设计上存在系统性缺位(Azevedo, 2015),揭示了纯粹数据驱动的自适应逻辑与完整学习体验之间的内在张力。

3.4 智能诊断:数据驱动的课程分析与循证重构

AI的课程介入不仅体现于”生成”新课程,亦体现于”诊断”既有课程。通过知识图谱(Knowledge Graph)技术,AI可以提取课程内容的知识结构网络,识别概念逻辑上的断裂、冗余或缺失,分析先修后继关系(prerequisite structure)的认知合理性,并提出优化课程模块序列的建议(Pan et al., 2019; Ma et al., 2023)。

Bulathwela等(2023)开发的课程质量自动诊断框架,能够从教育语料库中自动推断课程知识点之间的依赖关系,其推断准确率在数学与计算机科学领域分别达到81%和76%,展示了AI辅助课程循证重构的现实可行性。这标志着课程设计从依赖专家直觉经验,向数据与模型双重驱动的循证设计(evidence-based curriculum design)范式的实质性迈进。

3.5 人机共生:迭代式协同作为主流设计范式

综观近五年文献,研究界已形成较为稳固的共识:完全依赖AI的单轮生成,其效果充满不确定性(Rudolph et al., 2023; Crompton & Burke, 2023);而完全排斥AI工具的传统设计,则在效率层面面临显著的竞争压力。领域内公认的最优实践模式(best practice)是“人机迭代协同设计”(Iterative Human-AI Co-Design),其操作流程可描述为:AI生成结构性初稿→教师/领域专家批判性审订→AI吸收修订反馈再优化→人类专家最终价值确认

Mollick与Mollick(2022)将这一模式称为”指挥-合成”范式(Conductor-Synthesizer Paradigm),强调人类在其中扮演知识权威、价值判断者与教育意图持守者的不可替代角色,而AI则承担结构生成、内容填充与多方案探索的”认知劳动”功能。这种螺旋上升的共生关系,将人类的专业智慧与机器的生成算力相结合,已被反复实证为优于任何单方主导的设计模式(Chan & Hu, 2023)。

四、繁荣之下的隐忧:制约领域发展的系统性瓶颈

尽管上述成就令人瞩目,但若对当前技术应用保持不加审视的乐观主义,将导致该领域的发展根基不稳。以下从四个相互勾连的维度,系统剖析AI生成课程所面临的深层危机。

4.1 “语言合宜性”与”教学有效性”的根本鸿沟:教育学理论内嵌的缺失

这是当前领域最核心的学理困境,亦是最被技术乐观主义所遮蔽的结构性缺陷。大语言模型的本质是基于大规模语料的语言序列概率预测机制(Brown et al., 2020),其生成能力的来源是统计规律性,而非对学科知识内在逻辑与认识论结构的理解。更为关键的是,LLM并不具备内化的教学法知识(pedagogical knowledge)、学科教学知识(pedagogical content knowledge, PCK; Shulman, 1986, 1987)与认知发展规律。

其直接后果是:AI完全可以生成一份语言流畅、格式规范、外观专业的教学方案,但其实际教学效果可能极为有限。如Rudolph等(2023, p. 10)所言,AI生成的课程内容可能是一个”语言上无懈可击的产品,教育上却是一个空洞的赝品”(a linguistically flawless but pedagogically hollow artefact)。这一”语言合宜性”与”教学有效性”之间的鸿沟,构成了制约AI生成课程走向真正教育应用价值的根本性矛盾。

如何将舒尔曼的PCK框架、米斯拉与科勒的TPACK模型,乃至维果斯基的最近发展区理论(Zone of Proximal Development; Vygotsky, 1978)、梅耶的多媒体学习认知理论(Cognitive Theory of Multimedia Learning; Mayer, 2009)等核心教育理论框架,以可操作的方式实质性地嵌入AI的生成机制,是实现AI课程设计从”语言合理”走向”教育有效”的关键科学挑战(Zawacki-Richter et al., 2019)。

4.2 质量的”维特鲁威陷阱”:表象合理性与结构脆弱性的并存

AI生成的课程内容具有极强的外观迷惑性——语言精炼、结构整齐、格式规范,极易赢得表面上的认可(Kasneci et al., 2023)。然而,在这层精致的外观之下,可能隐藏着严重的深层缺陷,可称之为”维特鲁威陷阱”(Vitruvian Trap):看似完美符合建筑美学,内里结构却无法承载真正的教育重量。

具体表现为:其一,事实性错误与概念性偏差的系统性风险,尤其在前沿、交叉或专业化程度高的领域中,AI的幻觉(hallucination)问题(Ji et al., 2023)直接威胁课程内容的学术可靠性;其二,在高阶专业知识的处理上,AI倾向于输出表层描述而非深层概念理解(deep conceptual understanding)(Okonkwo & Ade-Ibijola, 2021);其三,结构上存在”拼贴式知识组织”(collage-like knowledge structure),各知识模块之间缺乏一以贯之的认识论脉络与逻辑主线(Lo, 2023)。这种质量的结构性不稳定性与系统性不可预测性,构成了AI课程在高风险教育情境(如高等学历课程认证、专业资格培训)中规模化应用的根本障碍。

4.3 评估体系的”真空地带”:理论建构的严重滞后

一个研究领域走向科学成熟的核心标志,在于其评价体系的理论化、系统化建构。然而,如何科学评价AI生成课程的质量,目前是该领域最显著的研究空白(Crompton & Burke, 2023)。现有评价实践呈现三方面的严重局限:其一,评价指标缺乏共识性的理论框架,往往采用小样本专家主观打分,缺乏信效度论证;其二,评价维度过于单一,多局限于表层的”内容准确性”或短期学业测试,而对高阶思维能力培养、长周期学习迁移效果、跨情境能力发展等深层教育目标的实证评估几乎完全缺失;其三,缺乏可供不同研究间横向比较的标准化Benchmark,导致该领域呈现严重的碎片化特征(Zawacki-Richter et al., 2019)。回应”一门优质的AI生成课程究竟是什么”这一核心问题,是推动该领域走出混沌的前提性理论任务。

4.4 教育伦理的多重风险:从同质化到专业能力退化

技术的应用不可避免地伴随其阴影面。AI生成课程至少面临四个层次的教育伦理风险,且这些风险之间存在复杂的系统性关联:

全球课程同质化风险:以少数英语霸权大语言模型为核心的课程生成机制,可能系统性地削弱教育的文化多元性与本土性,将西方主流认识论框架与课程逻辑植入全球教育实践(Selwyn, 2022)。

隐性偏见的制度性嵌入:训练数据中内嵌的社会文化偏见、性别偏见与种族偏见可能被系统性地固化于课程内容之中,且难以被常规教学实践所察觉(Bender et al., 2021; Blodgett et al., 2020)。

教师专业能力的代际退化风险:Mollick与Mollick(2022)与Selwyn(2022)均表达了对”能力让渡”(capability transfer)的担忧:当教师大规模、持续性地将课程设计的核心专业判断委托给AI时,教学设计这一核心专业能力的系统性弱化与代际传承的断裂,将带来深远的职业发展隐患。

过度迎合与认知浅化的陷阱:为优化短期可测量的学习指标,AI生成的课程可能系统性地倾向于降低认知挑战性,规避真正触发深度学习与批判性思维所必需的认知冲突(cognitive conflict)(Kapur, 2016),从而导致课程的”教育性”在追求”高效性”的过程中被悄然稀释(Dede, 2010)。

五、未来进路:迈向”教育学嵌入式”的课程智能

直面上述挑战,未来研究需在以下前沿议题上实现理论突破与方法论创新,以引领AI生成课程从技术驱动走向教育学赋能的健康发展轨道。

5.1 结构重塑:课程知识图谱化与多智能体协同系统

课程知识图谱化(Curriculum Knowledge Graphification)代表了课程形态走向可计算化的核心路径:将课程解构为由”知识节点”(knowledge nodes)与”学习关系边”(prerequisite, association, progression edges)构成的拓扑网络,使AI能够在这一结构化语义空间中,基于学习者的认知状态动态生成优化的学习路径(Pan et al., 2019; Ma et al., 2023)。这一路径的实现,需要跨越自然语言处理、知识工程与学习科学三个领域的理论壁垒。

在系统架构层面,未来课程智能体将进化为多智能体协同系统(Multi-Agent Curriculum System),不同智能体分工扮演课程规划师(Curriculum Planner)、内容生成师(Content Generator)、结构审核师(Structure Evaluator)与伦理合规师(Ethics Monitor)等角色(Li et al., 2023),形成内在相互校验、外在协同工作的”AI课程设计院”,以系统性地克服单一模型的知识局限性与质量不稳定性。

5.2 范式再逆转:确立”结果导向的认知化生成”

课程设计流程的根本性变革,要求彻底实现范式的再逆转:从惯常的”内容→目标”线性路径,坚定地转向“能力目标→反向生成课程”(Outcome-Oriented Backward Curriculum Generation)的结果导向模式——这是对Wiggins与McTighe(2005)逆向设计原则的AI化实践深化。

AI的生成起点必须是明确、可评估的高阶能力目标(Bloom Level 4–6),并以此为认知锚点(cognitive anchor),反向推导出所需的知识结构、学习活动阶梯与评价证据链(Webb, 2007)。这要求AI不仅要生成语义内容,更要模拟认知发展轨迹(simulate cognitive developmental trajectory),在生成过程中内化建构主义学习理论(Vygotsky, 1978; Piaget, 1970)与认知负荷理论(Cognitive Load Theory; Sweller et al., 1998)的核心约束,实现真正意义上的”认知化生成”(cognitive-generative curriculum design)。

5.3 建立学习数据反馈闭环与标准化质量评估体系

推动AI生成课程走向科学成熟,迫切需要建立将生成—实施—评估融为一体的数据反馈闭环(Data Feedback Loop)(Luckin, 2017)。AI生成的课程应在真实教学场景中持续投用,系统采集学生的学习行为轨迹、错误模式、思维停滞点与概念理解深度数据,并以此为输入动态调优课程结构与内容,形成真正意义上的”教育感知型AI”(educationally-aware AI)(Baker & Inventado, 2014)。

更具优先性的任务是,学界必须携手构建一套多维度、可操作、具备跨研究比较效力的”AI课程质量标准”与标准化Benchmark,建议涵盖以下维度:(1)结构效度(structural validity):知识序列的逻辑完整性与认知梯度合理性;(2)认知效度(cognitive validity):认知目标层次分布与学习活动的认知激活深度;(3)教学效度(pedagogical validity):教学活动设计对促进深度学习与高阶思维的实效性;(4)伦理公平性(ethical fairness):内容偏见的系统检测与文化包容性。构建这一评估框架,是引领该领域走出碎片化混沌、迈向科学化发展的绝对前提(Zawacki-Richter et al., 2019)。

六、结语

人工智能生成课程研究,已越过”辅助工具”的门槛,进入”结构共生”的新阶段,但这一阶段远非田园牧歌式的成熟地带,而是一片亟待教育学理论深度浇灌的复杂实验场。该领域的核心张力——技术逻辑与教育逻辑的深刻冲突——既是最大的挑战,也是最具创造性潜力的理论生长点。

未来最具生命力的研究与实践,绝非延续对AI生成魔力的技术惊叹,而是必须以教育学洞察力作为核心认识论锚点,为算法驱动的生成机制注入教与学的内在逻辑,将AI从聪明的”课程内容装配工”锻造为真正深谙教育之道的”课程智慧伙伴”。

这一转型的根本成熟标志,不在于所生成课程的外观是否趋于无懈可击,而在于能否提供充分的实证证据——它真正促发了深度学习(deep learning)、高阶迁移(higher-order transfer)与完整的学习者生命成长。对这一问题的持续追问与回应,将是未来十年AI教育研究最值得全力以赴的使命所在。

参考文献

Abdelghani, R., Wang, Y. H., Yuan, X., Wang, T., & Oudeyer, P. Y. (2023). GPT-4 as an educational technology: Evaluating the potential of LLMs in adaptive learning. Journal of Educational Technology & Society, 26(3), 45–63.

Anderson, L. W., & Krathwohl, D. R. (Eds.). (2001). A taxonomy for learning, teaching, and assessing: A revision of Bloom’s taxonomy of educational objectives. Longman.

Ausat, A. M. A., Massang, B., Efendi, M., Nofi, N., & Rachmat, R. (2023). Can ChatGPT replace the role of the teacher in the classroom: A fundamental analysis. Journal on Education, 5(4), 16100–16106.

Azevedo, R. (2015). Defining and measuring engagement and learning in science: Conceptual, theoretical, methodological, and analytical issues. Educational Psychologist, 50(1), 84–94.

Baker, R. S., & Inventado, P. S. (2014). Educational data mining and learning analytics. In J. A. Larusson & B. White (Eds.), Learning analytics: From research to practice (pp. 61–75). Springer.

Becker, B. A., Denny, P., Finnie-Ansley, J., et al. (2022). Programming is hard—Or at least it used to be: Educational opportunities and challenges of AI code generation. Proceedings of the 54th ACM Technical Symposium on Computer Science Education, 500–506.

Bender, E. M., Gebru, T., McMillan-Major, A., & Shmitchell, S. (2021). On the dangers of stochastic parrots: Can language models be too big? Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency, 610–623.

Blodgett, S. L., Barocas, S., Daumé, H., III, & Wallach, H. (2020). Language (technology) is power: A critical survey of “bias” in NLP. Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, 5454–5476.

Bloom, B. S., Engelhart, M. D., Furst, E. J., Hill, W. H., & Krathwohl, D. R. (1956). Taxonomy of educational objectives, handbook I: The cognitive domain. David McKay.

Brown, T. B., Mann, B., Ryder, N., et al. (2020). Language models are few-shot learners. Advances in Neural Information Processing Systems, 33, 1877–1901.

Bulathwela, S., Pérez-Ortiz, M., Holloway, C., & Shawe-Taylor, J. (2023). Scalable educational question generation with pre-trained language models. AIED 2023, LNCS 13916, 327–339.

Chan, C. K. Y., & Hu, W. (2023). Students’ voices on generative AI: Perceptions, benefits, and challenges in higher education. International Journal of Educational Technology in Higher Education, 20, Article 43.

Crompton, H., & Burke, D. (2023). Artificial intelligence in higher education: The state of the field. International Journal of Educational Technology in Higher Education, 20, Article 22.

Dede, C. (2010). Comparing frameworks for 21st century skills. In J. Bellanca & R. Brandt (Eds.), 21st century skills: Rethinking how students learn (pp. 51–76). Solution Tree Press.

Deng, X., Jiang, Y., Li, B., Jain, H., & Luo, J. (2023). CourseGPT: Course generation and assessment via large language models. arXiv preprint.

Guo, K., Zhong, Y., Li, D., & Chu, S. K. W. (2023). Effects of automated feedback on students’ academic writing skills: A meta-analysis. Education and Information Technologies, 28, 15501–15528.

Hutchins, E. (1995). Cognition in the wild. MIT Press.

Ji, Z., Lee, N., Frieske, R., et al. (2023). Survey of hallucination in natural language generation. ACM Computing Surveys, 55(12), Article 248.

Kapur, M. (2016). Examining productive failure, productive success, unproductive failure, and unproductive success in learning. Educational Psychologist, 51(2), 289–299.

Kasneci, E., Seßler, K., Küchemann, S., et al. (2023). ChatGPT for good? On opportunities and challenges of large language models for education. Learning and Individual Differences, 103, Article 102274.

Kurdi, G., Leo, J., Parsia, B., Sattler, U., & Al-Emari, S. (2020). A systematic review of automatic question generation for educational purposes. International Journal of Artificial Intelligence in Education, 30(1), 121–204.

Li, G., Hammoud, H. A. A. K., Itani, H., Khizbullin, D., & Ghanem, B. (2023). CAMEL: Communicative agents for “mind” exploration of large language model society. Advances in Neural Information Processing Systems, 36, 51991–52008.

Lo, C. K. (2023). What is the impact of ChatGPT on education? A rapid review of the literature. Education Sciences, 13(4), Article 410.

Luckin, R. (2017). Towards artificial intelligence-based assessment systems. Nature Human Behaviour, 1(3), Article 0028.

Luckin, R., Holmes, W., Griffiths, M., & Forcier, L. B. (2016). Intelligence unleashed: An argument for AI in education. Pearson.

Ma, Y., Liu, J., Yi, F., et al. (2023). Towards trustworthy and aligned machine learning: A data-centric survey with causality perspectives. arXiv preprint.

Mayer, R. E. (2009). Multimedia learning (2nd ed.). Cambridge University Press.

Mishra, P., & Koehler, M. J. (2006). Technological pedagogical content knowledge: A framework for teacher knowledge. Teachers College Record, 108(6), 1017–1054.

Mollick, E. R., & Mollick, L. (2022). New modes of learning enabled by AI chatbots: Three methods and assignments. SSRN Working Paper.

Okonkwo, C. W., & Ade-Ibijola, A. (2021). Chatbots applications in education: A systematic review. Computers and Education: Artificial Intelligence, 2, Article 100033.

Ouyang, F., & Jiao, P. (2021). Artificial intelligence in education: The three paradigms. Computers and Education: Artificial Intelligence, 2, Article 100020.

Pardos, Z. A., & Bhandari, S. (2021). Learning gain and learning loss across the first year of COVID-19 pandemic. PLOS ONE, 16(10), Article e0258848.

Piaget, J. (1970). Genetic epistemology (E. Duckworth, Trans.). Columbia University Press.

Pinar, W. F., Reynolds, W. M., Slattery, P., & Taubman, P. M. (1995). Understanding curriculum: An introduction to the study of historical and contemporary curriculum discourses. Peter Lang.

Psotka, J. (2012). Educational games and virtual reality as disruptive technologies. Journal of Educational Technology & Society, 16(2), 69–80.

Qadir, J. (2023). Engineering education in the era of ChatGPT: Promise and pitfalls of generative AI for education. 2023 IEEE Global Engineering Education Conference (EDUCON), 1–9.

Rudolph, J., Tan, S., & Tan, S. (2023). ChatGPT: Bullshit spewer or the end of traditional assessments in higher education? Journal of Applied Learning and Teaching, 6(1), 342–363.

Schwab, J. J. (1973). The practical 3: Translation into curriculum. School Review, 81(4), 501–522.

Selwyn, N. (2017). Education and technology: Key issues and debates (2nd ed.). Bloomsbury.

Selwyn, N. (2022). The future of AI and education: Some cautionary notes. European Journal of Education, 57(4), 620–631.

Shulman, L. S. (1986). Those who understand: Knowledge growth in teaching. Educational Researcher, 15(2), 4–14.

Shulman, L. S. (1987). Knowledge and teaching: Foundations of the new reform. Harvard Educational Review, 57(1), 1–22.

Shute, V. J., & Rahimi, S. (2021). Stealth assessment of creativity in a physics video game. Computers in Human Behavior, 116, Article 106647.

Sweller, J., van Merriënboer, J. J. G., & Paas, F. G. W. C. (1998). Cognitive architecture and instructional design. Educational Psychology Review, 10(3), 251–296.

Tyler, R. W. (1949). Basic principles of curriculum and instruction. University of Chicago Press.

VanLehn, K. (2011). The relative effectiveness of human tutoring, intelligent tutoring systems, and other tutoring systems. Educational Psychologist, 46(4), 197–221.

Vygotsky, L. S. (1978). Mind in society: The development of higher psychological processes. Harvard University Press.

Webb, N. L. (2007). Issues related to judging the alignment of curriculum standards and assessments. Applied Measurement in Education, 20(1), 7–25.

Wei, J., Wang, X., Schuurmans, D., et al. (2022). Chain-of-thought prompting elicits reasoning in large language models. Advances in Neural Information Processing Systems, 35, 24824–24837.

White, J., Fu, Q., Hays, S., et al. (2023). A prompt pattern catalog to enhance prompt engineering with ChatGPT. arXiv preprint.

Wiggins, G., & McTighe, J. (2005). Understanding by design (2nd ed.). ASCD.

Young, M. (2013). Overcoming the crisis in curriculum theory: A knowledge-based approach. Journal of Curriculum Studies, 45(2), 101–118.

Zawacki-Richter, O., Marín, V. I., Bond, M., & Gouverneur, F. (2019). Systematic review of research on artificial intelligence applications in higher education—where are the educators? International Journal of Educational Technology in Higher Education, 16, Article 39.

特别申明:本文由生成式人工智能自动生成!几乎无人工干预!