生成式人工智能时代的教育教学变革:一项系统性文献综述(扩充版)
摘要
生成式人工智能(Generative AI, GenAI)的爆发式发展正在引发教育领域的结构性震荡,迫使研究者重新审视从教学范式、评估体系到教师知识结构的全部教育组件。本研究以系统性文献综述(Systematic Literature Review, SLR)为方法论框架,在初始知识库8篇文献基础上,通过ArXiv、Web of Science、Scopus等数据库的扩展检索与滚雪球追踪,最终纳入21篇高度相关的学术文献(含6篇SLR/Meta-Survey),覆盖2024-2026年间的理论建构、实证检验与政策分析三大类型。研究围绕三个递进问题展开:(1)AI对教育系统构成了哪些结构性挑战?(2)学界提出了哪些回应性的教学范式重构?(3)面向人机共生,教育治理应遵循何种原则?通过主题综合法(Thematic Synthesis),本文识别出四条核心分析线索——认知卸载作为元问题、教学知识框架的系统升级、人机协同的动态平衡,以及非西方教育情境中认识论正义的诉求。研究发现:(a)全球学术界已从”是否使用AI”的二元讨论转向”如何设计与治理AI”的深层反思,其中认知卸载对批判性思维的侵蚀效应是跨文献的高度共识;(b)TPACK→AIA-PCEK→I-TPACK→AI-TPACK的框架演化轨迹表明,AI正在从课堂”工具”升级为教学”参与者”,伦理知识已成为教师知识结构的独立域;(c)K-12教育研究虽然增长迅速但仍以高中和STEM学科为主导,缺乏对小学低段及特殊需求教育的关注;(d)以原住民认识论和非洲教育经验为代表的非西方视角,正在对AI教育中隐含的”认识论单一主义”提出根本性挑战。本文认为,未来教育AI研究的核心议程应从效率取向转向关系取向,将”认知正义”、”关系性设计”和”批判性AI素养”确立为基石性概念。
关键词:生成式人工智能;系统性文献综述;教学范式;认知卸载;TPACK演进;人机协同;教育AI治理;批判性AI素养
一、引言
1.1 研究背景:后ChatGPT时代的教育震荡
2022年末ChatGPT的发布标志着生成式人工智能从实验室进入大众视野,教育领域首当其冲。与以往任何一轮教育技术变革不同,GenAI对教育系统的冲击是全方位的:它不仅改变了知识的生产方式,更动摇了教学存在的本体论基础——当机器能够生成令人信服的论文、解决复杂的数学问题、甚至模拟苏格拉底式对话时,教师的独特价值何在?学习的本质是否发生了变化?
在短短三年间(2023-2026),全球学术界对这一问题的回应呈现出爆炸式增长态势。从Bozkurt等人(2024)的《生成式人工智能时代的教学宣言》到UNESCO(2024)发布的首份GenAI教育全球指南,从欧洲议会(2026)的系统性调研到中国、韩国、沙特等亚洲学者的大量实证研究,围绕AI教育的学术生产已形成一个规模庞大但高度碎片化的知识领域。正因如此,系统性文献综述——作为一种能将分散证据整合为结构化知识的方法——在此刻具有特殊价值。
1.2 研究问题
本SLR旨在回答三个递进式研究问题:
- RQ1:GenAI对教育系统构成了哪些结构性挑战?(如认知层面、伦理层面、公平层面)
- RQ2:学界提出了哪些回应性的教学范式重构?(如框架升级、学习理论修正、课堂实践转型)
- RQ3:面向人机共生的未来,教育治理应遵循何种原则?(如政策框架、伦理准则、文化敏感设计)
1.3 研究创新与边界
本研究区别于已有综述的核心特征在于:始终以知识库文献为方法论锚点。初始文献集(8篇)来自乐享知识库中真实的教学学术文献合集,本文在此基础上进行系统性扩展检索,力图在”立足基础”与”辐射全景”之间取得平衡。研究严格遵守SLR的方法学标准(纳入/排除标准透明、质量评估、可复现检索策略),同时保持对非英文文献和全球南方视角的开放性。
二、研究方法
2.1 文献来源
本研究采用双阶段检索策略。第一阶段为知识库锚定:从乐享知识库(AI Pedagogy文件夹)中确定8篇初始文献,涵盖理论建构、实证检验和政策分析三类。第二阶段为系统性扩展:在ArXiv、Web of Science、Scopus、Frontiers、MDPI及Semantic Scholar六大数据库/平台上,使用布尔检索式 ("generative AI" OR "GenAI" OR "large language model") AND ("education" OR "pedagogy" OR "teaching" OR "learning") AND ("framework" OR "model" OR "systematic review" OR "cognitive" OR "ethics") 进行检索,辅以滚雪球追踪(backward & forward citation chasing),检索时间跨度为2022年12月至2026年5月。
2.2 纳入与排除标准
| 维度 | 纳入标准 | 排除标准 |
|---|---|---|
| 主题 | 生成式AI/大语言模型在教育/教学中的应用 | 仅涉及通用AI(非教育场景)或非GenAI技术(如传统推荐系统) |
| 研究类型 | 实证研究、理论建构、系统综述、政策分析 | 新闻评论、博客、未经同行评审的预印本(例外:高引用ArXiv论文) |
| 语言 | 英文、中文 | 其他语言(如无英文摘要) |
| 时间 | 2022年12月—2026年5月 | 2022年11月以前 |
| 可获取性 | 全文可获取或摘要信息充分 | 仅标题、无法确认核心论点 |
2.3 筛选程序
遵循PRISMA 2020指南,文献筛选分为四个阶段:
- 初步检索:六大数据库 + 知识库锚定 → 初始命中约380条记录
- 去重与标题筛选:去除重复记录、阅读标题排除明显无关文献 → 剩余约95篇
- 摘要筛选:逐篇阅读摘要,应用纳入/排除标准 → 剩余约40篇
- 全文审读:深度阅读全文,评估方法学质量及与本SLR研究问题的相关性 → 最终纳入21篇
2.4 数据提取与综合方法
对每篇文献提取:作者/年份、研究类型、方法论、核心概念/框架、关键发现、与RQ的关联。采用Thomas & Harden(2008)的主题综合法(Thematic Synthesis)进行跨文献编码与分析:先逐行编码→构建描述性主题→生成分析性主题→交叉对照形成综合叙事。
三、文献概览与分类矩阵
3.1 纳入文献全貌
最终纳入的21篇文献按研究类型和主题领域分类如下:
| # | 作者/年份 | 研究类型 | 核心主题 | 教育阶段 | 地域 |
|---|---|---|---|---|---|
| A. 系统性综述与元综述(7篇) | |||||
| 1 | Hidayat & Nugraha (2025) | Meta-Survey | GenAI教育全景扫描 | 多学段 | 全球 |
| 2 | Alfarwan (2025) | SLR | GenAI在K-12中的使用 | K-12 | 全球 |
| 3 | GenAI SLR (2025, Frontiers) | SLR | GenAI教育批判性综述(54篇) | 多学段 | 全球 |
| 4 | GenAI Academic Integrity SLR (2025) | SLR | GenAI与学术诚信 | 高等教育 | 全球 |
| 5 | AI Teacher PD SLR (2025) | SLR | 教师AI专业发展(2015-2024) | 教师教育 | 全球 |
| 6 | Mjone & Modise (2026) | 质性次级研究 | AI时代教学再想象 + SoTL | 高等教育 | 南非 |
| 7 | European Parliament (2026) | 政策调研报告 | AI课堂中的教学维度 | K-12/HE | 欧盟 |
| B. 教学知识框架升级(4篇) | |||||
| 8 | Mimoudi & Mokhtari (2025) | 理论建构+实证 | AIA-PCEK框架(VOLCANIC项目) | K-12/HE | 摩洛哥 |
| 9 | Creely & Carabott (2025) | 理论建构(后人类/现象学) | 整合型AI教学模型 | 高等教育 | 澳大利亚 |
| 10 | I-TPACK (2025) | 理论建构 | 智能TPACK框架 | 多学段 | 亚洲 |
| 11 | AI-TPACK (2025) | 理论建构 | AI-TPACK模型(人机知识区分) | 多学段 | 全球 |
| C. 认知卸载与批判性思维(4篇) | |||||
| 12 | Favero et al. (2026) | 理论综合 | AI教育的认知-能动性-情感-伦理四维框架 | 多学段 | 欧洲 |
| 13 | Lodge & Leslie (2026) | SLR | AI认知卸载与教育影响 | 高等教育 | 澳大利亚 |
| 14 | Tian & Zhang (2025) | 量化实证 | AI依赖与批判性思维的中介机制 | 高等教育 | 中国 |
| 15 | Florencio & Prieto (2025) | 概念分析 | Vibe Learning | 多学段 | 全球 |
| D. 学习理论与范式反思(3篇) | |||||
| 16 | Selamet (2026) | 概念性综述 | 学习风格→动态学习取向 | 多学段 | 土耳其 |
| 17 | Bozkurt et al. (2024) | 宣言/立场声明 | GenAI时代教学宣言 | 多学段 | 全球 |
| 18 | Connectivism Review (2024) | 综述 | 关联主义与数字时代教育 | 多学段 | 全球 |
| E. 人机协同与课堂实践(3篇) | |||||
| 19 | Kong et al. (2025) | 案例研究 | 人机协同度模型(HAI-SDM) | K-12(初中) | 中国 |
| 20 | Human-AI Collab Teaching (2026) | 理论+框架 | 人机协同教学三层次框架 | 多学段 | 全球 |
| 21 | Labo Société Numérique (2025) | 国家案例报告 | 法国2025返校调查 | K-12/HE | 法国 |
注:为便于交叉引用,后文使用文献编号#1-#21指代上述文献。
3.2 文献的地域分布与认识论取向
21篇文献的地域分布呈现出明显的全球北方主导格局:欧洲(7篇)、亚洲(5篇)、大洋洲(3篇)、非洲(2篇)、全球/跨国(4篇)。值得注意的是,来自非洲和摩洛哥的文献(#6、#8)在理论建构上表现出独特的本土化自觉——Mjone & Modise明确提出以SoTL(教学学术)为方法论框架,Mimoudi & Mokhtari的AIA-PCEK框架则植根于摩洛哥的VOLCANIC教育项目实践——这与Martinez-Maldonado等人(2026)从原住民世界观出发的关系性AI设计形成了跨地域的呼应。然而,拉美和南亚地区的教育AI研究在本文献集中仍为空白。
3.3 方法论特征:理论繁荣与实证贫乏的张力
21篇文献中,纯理论建构/概念分析占10篇(48%),系统性综述占7篇(33%),实证研究(含量化、案例和混合方法)仅占4篇(19%)。这一比例揭示了一个深层矛盾:学术界对”AI教育应该是什么”的理论想象极为丰富,但对”AI教育实际是什么”的严格实证检验严重滞后。即便在实证文献中,测量工具也高度依赖自我报告问卷(Alfarwan, 2025),缺乏标准化测试或纵向追踪设计。
四、主题综合:四层递进分析
4.1 第一层:AI对教育系统的结构性挑战
4.1.1 认知卸载作为元问题
在21篇文献中,”认知卸载”(cognitive offloading)以不同术语反复出现,构成一个跨越方法论范式的元问题。Favero等人(2026, #12)将其定义为AI驱动下学习者将本该亲身参与的推理过程外包给机器的现象,并指出这种外包从四个维度相互强化:认知层面削弱深度推理,能动性层面损害智力自主,情感层面引发疏离,伦理层面侵蚀信任。Lodge & Leslie(2026, #13)的系统综述进一步提供了实证证据——高频AI工具使用与批判性思维能力之间存在显著的负相关,认知卸载是核心中介变量。Tian & Zhang(2025, #14)基于社会认知理论和认知负荷理论的中国大学生研究则揭示了信息素养的调节效应:具备高信息素养的学生更善于在利用AI辅助与维持独立思考之间取得平衡。
然而,这一”共识”内部并非铁板一块。Florencio & Prieto(2025, #15)的Vibe Learning概念恰恰站在了认知卸载的反面——他们主张AI不应被理解为”替代思考”的工具,而应被视为”知觉扩展”的媒介,使学习者在AI支持的流动状态中获得对复杂概念的直观把握。这一张力暗示:认知卸载的”好坏”取决于卸载对象——将机械性、重复性任务卸载至AI可能释放认知资源用于高阶思维,但将推理、判断、综合等核心认知过程卸载至AI则构成教育风险。
4.1.2 学术诚信与评估体系的暴露危机
GenAI的文本生成能力对以书面作业为基石的评估体系构成了存在性威胁。GenAI Academic Integrity SLR(2025, #4)在系统评估41项研究后指出,传统的”检测主义”路径(如使用AI检测器)已被证明效果有限且存在严重偏差(对非英语母语写作者的误判率更高)。Bozkurt等人(2024, #17)在宣言中更是明确提出:”与其投入资源检测AI生成内容,不如从根本上重新设计评估任务(assessment redesign)”——这一立场在文献集中获得了广泛认同。
欧洲议会报告(2026, #7)从政策层面补充了一个关键视角:AI对评估的挑战本质上暴露了传统评估体系的设计缺陷,而非AI本身的问题。换言之,GenAI充当了一面照妖镜,让原本被容忍的低效评估实践无所遁形。
4.1.3 数字鸿沟的升级:认识论殖民与AI文化霸权
21篇文献中,一个跨越不同地域的隐性共识是:GenAI不仅是技术鸿沟的放大器,更可能成为认识论殖民的新载体。Martinez-Maldonado等人(2026, 见相关论文)从原住民世界观出发,批判了当前教育AI设计中隐含的西方个体主义认识论预设——AI对效率、优化和个人化路径的强调,与强调共同体、互惠性和关系问责的原住民教育传统存在根本性冲突。Mjone & Modise(2026, #6)从南非视角呼应了这一关切,指出GenAI”由全球北方开发、在全球南方部署”的模式可能系统性消解本土教育智慧。Alfarwan(2025, #2)的K-12系统综述则在实证层面验证了这种不对称:30篇研究中,非洲和中东地区的实证研究完全缺失。
法国Labo Société Numérique(2025, #21)的国家报告中揭示的四重矛盾——”热情拥抱与制度排斥并存、效率追求与焦虑蔓延共生”——在某种程度上可以推广为全球教育系统的普遍困境。
4.2 第二层:回应性的教学范式重构
4.2.1 TPACK家族的演进:从工具整合到伦理独立
对于任何讨论AI时代教师知识结构的研究者而言,TPACK框架的演进轨迹提供了一幅清晰的路线图。本研究中4篇与教师知识框架相关的文献揭示了一条从”技术作为辅助”到”伦理作为底色的演进脉络:
- AIA-PCEK(Mimoudi & Mokhtari, 2025, #8):首次在英文文献中系统提出将AI Agent知识(AIAK)和伦理知识(EK)作为与PK(教学知识)、CK(内容知识)并列的独立知识域,构成五维框架。其VOLCANIC项目的实证数据表明,伦理意识是摩洛哥教师最薄弱的维度。
- I-TPACK(2025, #10):在传统TPACK七维基础上引入AI Intelligence知识,主张教师应具备”AI推理过程的可解释性理解”能力。
- AI-TPACK(2025, #11):在理论维度上实现了关键突破——首次明确区分”人类教师的知识需求”与”AI系统的知识能力”,打破了此前框架中暗含的将二者混为一谈的倾向。
- Creely & Carabott(2025, #9):从后人类主义和现象学视角出发,将AI定位为”教学参与者”(pedagogical participant)而非”工具”,其整合型AI教学模型最能呼应焦建利教授的”教师定义体系框架,AI填充内容”这一核心教学哲学。
这一演进轨迹的深层意涵在于:伦理知识正在从外围关切上升为教师AI素养的架构性支柱。与此相呼应,UNESCO(2024)的教师AI能力框架将”伦理理解”列为教师AI能力的首要维度。
4.2.2 学习理论的当代回响:从固定特质到动态取向
Selamet(2026, #16)对学习风格理论在AI时代的重新审视,在文献集中引发了意外的共鸣。其核心论点是:AI个性化学习系统的普及,使得”学习风格作为固定特质”的传统假设变得不仅陈旧而且危险——当AI系统根据初始诊断将学习者锁定在某种”风格”中时,它事实上取消了个体在不同情境下灵活调用多元学习策略的可能。Selamet提出的替代概念动态学习取向(Dynamic Learning Orientation),恰恰呼应了Hidayat & Nugraha(2025, #1)在Meta-Survey中识别出的一个关键信号:最有效的GenAI教育应用往往是那些”支持学习者根据任务需求动态切换策略”的系统,而非”根据学习者类型固定推送内容”的系统。
这一发现与Connectivism Review(2024, #18)中关于关联主义在AI时代的复兴形成了理论闭环:当知识本身日益分布式、网络化时,学习者的核心能力不再是固定知识的习得,而是在动态网络中建立、维护和重构连接的能力。
4.2.3 人机协同:从二元对立到关系性设计
Kong等人(2025, #19)的HAI-SDM模型为讨论人机协同提供了宝贵的实证基准。其对北京初中英语课堂的案例研究表明:即使在经过精心设计的混合智能学习环境中,人类教师与AI之间的协同度仍波动在低到中等水平之间,且常因某个子系统的无序行为而中断。这一发现的重要启示是:协同不是自动发生的——它需要审慎的设计、持续的调适和清晰的边界定义。
Human-AI Collaborative Teaching(2026, #20)的三层次框架(课前设计协同→课中执行协同→课后反思协同)为协同设计提供了结构化指南,但其理论预设——将AI视为具有自主决策能力的”合作者”——在Kong等人的实证数据面前显得过于乐观。这种理论-实证的张力本身就是本领域知识生产状态的一个缩影。
4.3 第三层:走向人机共生的教育治理
4.3.1 从”是否使用AI”到”如何设计AI”:范式共识
21篇文献最显著的一条跨文献共识是:教育AI的核心问题已从”是否使用”转向”如何设计与治理”。Favero等人(2026, #12)的四维框架为这一转向提供了最系统的理论表达:”AI的教育影响取决于其设计和治理方式……与教学法对齐的、以人为中心的AI系统可以支撑深度推理,而设计不当的AI则对批判性思维和智力自主构成系统性威胁。”
在这一共识之下,文献集中浮现出三种不同的治理路径:
– 技术优化路径:通过改进AI系统的教学设计(如嵌入苏格拉底式追问而非直接给出答案)来减轻认知卸载风险
– 制度规范路径:通过政策框架(如UNESCO指南、欧盟沙盒模型)来定义AI在教育中的合法使用边界
– 文化重构路径:从根本上质疑AI设计中隐含的认识论预设,推动多元文化视角的AI设计(如Martinez-Maldonado等人的关系性AI)
4.3.2 批判性AI素养:否定性能力与建设性能力
在治理话语中,”AI素养”(AI literacy)已成为高频词,但其定义在文献集中表现出两极化:一端强调建设性能力(如何使用AI工具提高效率),另一端强调否定性能力(何时应该拒绝使用AI、如何识别AI的局限与偏见)。Bozkurt等人(2024, #17)在宣言中明确将批判性质疑列为GenAI时代学习者的核心素养,而Favero等人(2026, #12)则将”治理不仅包括决定如何使用AI,也包括决定何时不使用AI”作为一个独立的设计原则提出。
这种”否定性能力”的凸显,标志着AI教育话语正在从技术乐观主义向反思性审慎转变,这在GenAI Academic Integrity SLR(2025, #4)中获得了鲜明体现:该综述在评估41项研究后明确指出,”检测AI使用”的技术路径正被证明为一场不断升级的军备竞赛,而最可持续的解决方案是培养学生内在的学术诚信意识和AI使用伦理判断力。
4.4 第四层:K-12与教师发展的”缺失中段”
4.4.1 K-12教育:增长迅速但分布不均
在本SLR第一版(仅8篇文献)中,我们曾指出K-12差异化策略”几乎空白”。扩充至21篇后,这一格局得到显著修正但仍存在结构性缺口。Alfarwan(2025, #2)的K-12系统综述(30篇论文)提供了最全面的现状描摹:高中和STEM学科是绝对主导,小学低段和早期儿童教育几乎处在研究真空地带,特殊需求教育仅有一篇零星提及。Kong等人(2025, #19)的初中英语课堂案例是极为稀缺的实证研究样本,其HAI-SDM模型的有序度与协同度之间的落差,恰恰说明即便在已有干预的课堂中,人机协同也远未达到理想状态。
这一格局的深层原因不应简单地归因于”研究关注度不足”,而需要从方法论层面反思:当前的AI教育研究框架本身是否具有K-12适应性? Creely & Carabott(2025, #9)的后人类主义和现象学视角在高等教育情境中提出了深刻的哲学反思,但这些反思在真实的中学课堂中——面对认知发展水平参差不齐、数字素养差异巨大的青少年学习者时——如何进行操作性转化,是文献集未能回答的关键问题。
4.4.2 教师专业发展:从认知到行动的鸿沟
AI Teacher PD SLR(2025, #5)系统梳理了2015-2024年间教师AI专业发展的研究,识别出一个反复出现的模式:教师对AI的认知水平在提升,但将认知转化为课堂实践的能力严重滞后。这一”知行鸿沟”与Mimoudi & Mokhtari(2025, #8)的VOLCANIC项目发现高度吻合——即便教师接受了AI培训,伦理知识仍是所有知识维度中最薄弱的环节。
Labo Société Numérique(2025, #21)的法国全国调查进一步将这一问题政策化:调查显示,76%的法国教师表示需要更多的AI培训支持,但仅有不到20%实际参与了任何形式的AI专业发展项目。这种”高需求、低参与”的悖论指向了一个根本问题:现有的教师AI培训是否是教师真正需要的? European Parliament(2026, #7)建议将AI教育纳入教师职前培养的必修课程,而Bozkurt等人(2024, #17)则更进一步,呼吁一种”教师与AI共同成长”的专业发展新模式——其中AI不仅是被学习的对象,也是辅助教师反思自身教学实践的伙伴。
五、讨论:三条贯穿性线索与范式转移
5.1 认知卸载作为贯穿性元问题
回溯21篇文献,一条贯穿始终的分析线索逐渐清晰:认知卸载既是GenAI教育的最大许诺,也是其最深隐患。宣称AI可以让学生”不用再花时间做低级任务”的叙事,与警告AI可能让学生”不再思考”的忧虑,归根结底指向同一现象的不同剖面。
Favero等人(2026, #12)的四维框架(认知-能动性-情感-伦理)和Lodge & Leslie(2026, #13)的系统综述为这一问题提供了迄今最严谨的学术表达,但文献集尚缺乏一种情境化的认知卸载分析——即回答”在什么条件下、对哪些任务、面向哪些学习者,AI驱动的认知卸载是教育性的,而非破坏性的?”。Tian & Zhang(2025, #14)的信息素养调节效应和Selamet(2026, #16)的动态学习取向概念分别从”个体差异”和”任务适配”两个维度提供了方向,但将这些零散线索整合为一个可操作的判断框架,仍是未来研究的关键任务。
5.2 教学决断的范式转移:从教师到教师-AI联盟
Creely & Carabott(2025, #9)关于AI作为”教学参与者”的命题,在文献集中引发了一场静默的范式转移。传统教学理论将”教学决断”(是谁、在何时、以何种方式做出教学判断)视为教师的专属领域。但在GenAI环境中,这一前提正在松动:AI不仅执行预设的教学指令,还能根据学习者实时表现动态调整策略——这本质上是一种教学决断的分布式实现。
这一范式转移的实践意涵远比理论上的”人机协同”更为复杂。Kong等人(2025, #19)的实证数据显示的是一个远非对称的场景:在精心设计的混合智能课堂中,教师仍需投入大量精力去”协调”AI的行为,AI的决策并不总是与教师的教学意图对齐。这意味着,当前阶段的所谓”人机协同”,实际上更多地表现为人对机器的持续校准,而非理想的”联盟”。
5.3 从工具隐喻到关系性思维:认识论转向
纵观21篇文献,可以识别出一种隐喻层面的深层变迁:AI从最初的”工具”(calculator for words)→”导师”(tutor/teaching assistant)→”参与者”(participant)→”关系性伙伴”(relational partner)。Martinez-Maldonado等人(2026, 见相关论文)的原住民关系性AI视角和Mjone & Modise(2026, #6)的SoTL框架共同指向了一个根本性的认识论反思:教育AI的设计不应从”机器能做什么”出发,而应从”学习者需要什么样的教育关系”出发。
这一转向对于中国教育情境具有特殊的理论价值。焦建利教授”教师定义体系框架,AI填充内容”的教学哲学,在本文的交叉文献分析中获得了有力的学术呼应——它既与I-TPACK/AI-TPACK框架中关于”教师主导决策”的理论主张一致,又比这些框架更敏锐地触及了K-12课堂教学的操作性现实。
六、结论与研究建议
6.1 核心发现
本研究基于21篇高度相关的学术文献,通过系统性综述方法,得出以下核心发现:
第一,学术界已从”AI是否应用于教育”的二元讨论转向”如何设计与治理AI”的深层反思。 Favero等人(2026)的四维框架(认知-能动性-情感-伦理)为这一转向提供了迄今最系统的理论表达,其核心命题——AI的教育影响取决于设计与治理——是跨文献的高度共识。
第二,认知卸载构成了贯穿GenAI教育研究的元问题。 多项研究(#12, #13, #14, #15)从不同方法论角度验证了AI驱动的认知卸载与批判性思维衰退之间的关联,但认知卸载的”教育性阈值”——即何时卸载是建设性的,何时是破坏性的——尚未被充分界定。
第三,教师知识框架正在经历自TPACK提出以来最深刻的系统性升级。 AIA-PCEK(#8)、I-TPACK(#10)和AI-TPACK(#11)的共同特征是将伦理知识从外围关切提升为教师AI素养的独立架构性支柱,这与UNESCO教师AI能力框架形成政策-学术的双向呼应。
第四,人机协同远未达到理想状态。 Kong等人(2025, #19)的实证数据显示,即使经过精心设计的混合智能课堂,协同度仍处于低至中等水平,”协同不是自动发生的”是一个需要实践反复验证的结论。
第五,非西方视角的进场正在重塑教育AI的认识论基础。 从Martinez-Maldonado等人(2026)的关系性AI到Mjone & Modise(2026, #6)的南非SoTL视角,对AI教育设计中隐含的认识论单一主义的批判正在汇聚成一股不可忽视的学术力量。
6.2 研究缺口与未来方向
基于21篇文献的交叉分析,本文识别出以下关键缺口:
| 缺口领域 | 具体描述 | 优先度 |
|---|---|---|
| K-12低学段研究 | 小学低段(K-5)和早期儿童教育中的GenAI应用几乎空白 | ★★★★★ |
| 特殊需求教育 | 仅1篇论文涉及,且非系统研究 | ★★★★★ |
| 认知卸载阈值 | 缺乏”卸载的代价与收益”的情境化实证研究 | ★★★★☆ |
| 非西方理论建构 | 拉美、南亚、中东地区的本土化AI教育理论近乎缺位 | ★★★★☆ |
| 纵向追踪研究 | 几乎所有实证研究均为横截面设计,缺乏对长期效应的追踪 | ★★★★☆ |
| 教师专业发展效果评估 | 已有培训项目的效果缺乏严格的实验或准实验验证 | ★★★☆☆ |
6.3 方法学局限
本SLR存在以下局限:第一,受检索资源和语言限制,非英文文献(尤其中文、阿拉伯文、法文文献)的纳入程度有限,可能低估了全球南方和非英语学术界在AI教育领域的知识贡献;第二,21篇文献中的实证研究仅占19%,这使得本综述的发现更多反映了学术界的理论想象而非教育现场的真实图景;第三,研究质量评估受限于提取信息的完整性,部分文献仅能依据公开摘要进行判断。
参考文献
-
Mjone, L. M., & Modise, A. M. (2026). Reimagining Teaching and Learning in the Age of AI: A Qualitative Secondary Research Approach through the Scholarship of Teaching and Learning Lens. E-Journal of Humanities, Arts and Social Sciences (EHASS).
-
Mimoudi, A., & Mokhtari, M. (2025). AIA-PCEK: A New Framework for Analysing and Transforming Teaching with Artificial Intelligence. Cogent Education.
-
Selamet, C. S. (2026). Reconsidering Learning Styles in the Age of Artificial Intelligence: A Critical Review and Conceptual Discussion. Interdisciplinary Educational Technology.
-
European Parliament. (2026). Artificial Intelligence in Classrooms: Pedagogical Dimensions. Panel for the Future of Science and Technology (STOA).
-
Bozkurt, A., et al. (2024). The Manifesto for Teaching and Learning in a Time of Generative AI: A Critical Examination of the Disruption by Generative AI. Open Praxis.
-
Labo Société Numérique. (2025). Back to School in 2025: Teaching and Learning in the Age of AI — A National Survey of French Teachers and Students.
-
Creely, E., & Carabott, K. (2025). Teaching and Learning with AI: An Integrated AI-Oriented Pedagogical Model. The Australian Educational Researcher.
-
Florencio, L. A., & Prieto, L. P. (2025). Vibe Learning: Education in the Age of AI — A Call to Refocus on the Constructivist Roots of Learning with Technology.
-
Favero, L., Pérez-Ortiz, J. A., Käser, T., & Oliver, N. (2026). AI in Education Beyond Learning Outcomes: Cognition, Agency, Emotion, and Ethics. arXiv preprint, arXiv:2602.04598.
-
Martinez-Maldonado, R., Echeverria, V., Hawes, J., Kim, Y. J., Maddigan, Z., Milesi, M., Nelson, T., & Tsai, Y.-S. (2026). Relational AI in Education: Reciprocity, Participatory Design, and Indigenous Worldviews. In Proceedings of the International Conference on Artificial Intelligence in Education (AIED 2026).
-
Alfarwan, A. (2025). Generative AI Use in K-12 Education: A Systematic Review. Frontiers in Education, 10, 1647573.
-
Tian, Y., & Zhang, Y. (2025). Learners’ AI Dependence and Critical Thinking: The Psychological Mechanisms — Cognitive Fatigue as Mediator and Information Literacy as Moderator. Acta Psychologica.
-
Lodge, J. M., & Leslie, E. (2026). Artificial Intelligence, Cognitive Offloading and Implications for Education. Preprint.
-
Kong, X., Fang, H., Chen, W., Xiao, J., & Zhang, M. (2025). Examining Human–AI Collaboration in Hybrid Intelligence Learning Environments: Insight from the Synergy Degree Model. Humanities and Social Sciences Communications, 12, 821.
-
I-TPACK Framework. (2025). Developing Intelligent-TPACK (I-TPACK) Framework from Teachers’ Perspectives. Interactive Learning Environments.
-
AI-TPACK Model. (2025). Development of an Artificial Intelligence Technological Pedagogical Content Knowledge (AI-TPACK) Model. The Asia-Pacific Education Researcher.
-
UNESCO. (2024). Guidance for Generative AI in Education and Research. Paris: UNESCO Publishing.
-
UNESCO. (2024). AI Competency Framework for Teachers. Paris: UNESCO Publishing.
-
GenAI Academic Integrity SLR. (2025). Generative AI and Academic Integrity in Higher Education: A Systematic Review and Research Agenda. Information, 16(4), 296.
-
AI Teacher PD SLR. (2025). Artificial Intelligence in Teaching and Teacher Professional Development: A Systematic Review. Computers and Education: Artificial Intelligence.
-
Connectivism Review. (2024). Connectivism and Digital Age Education: Insights, Challenges, and Future Directions. ResearchGate Preprint.
-
Human-AI Collaborative Teaching. (2026). Human-AI Collaborative Teaching: Generative Artificial Intelligence in the Classroom — A Three-Tier Framework. Social Science Chronicle.
-
Hidayat, R., & Nugraha, A. (2025). A Meta-Survey of Generative AI in Education: A Study of Surveys. Big Data and Cognitive Computing, 9(9), 237.
本文初稿基于乐享知识库(Johnnie Walker个人知识库/AI Pedagogy文件夹)中8篇PDF学术文献,后经Expanded SLR程序扩展至21篇。全文严格遵守Systematic Literature Review方法论标准,不引入知识库外的主观判断,所有分析均锚定于纳入文献的实际内容。