教育部禁止学生直接复制 AI 生成内容作为作业答案,执行难度如何?
5月12日,教育部发布《中小学人工智能通识教育指南(2025年版)》和《中小学生成式人工智能使用指南(2025年版)》(以下简称《使用指南》),以科学规范推进人工智能全学段教育。此中《使用指南》提出,禁止学生直接复制人工智能生成内容作为作业或测验答案,限制在缔造性任务中滥用人工智能。《使用指南》紧密围绕生成式人工智能在中小学教育中的应用场景,明确各学段使用规范,确保技术安全、合理、有效地辅助教学、促进学生个性化学习、敦促教育打点智能化,同时严守数据安全、伦理道德底线。《使用指南》提出“分学段差异化应用”,强调避免学生的过度技术依赖。教育部基础教育教学指导委员会负责人对此暗示,小学阶段学生在教师、家长辅佐下适切使用开放式内容生成功能,防止不合理使用影响学生常识建构与思维成长,教师在课内有效开展人机协同教学;初中阶段可适度探索生成内容的逻辑性分析,指导学生交叉验证生成内容的合理性;高中阶段可结合技术道理开展探究性学习,引导学生自主评估生成内容的社会影响。这一设计旨在平衡技术应用潜力与学生春秋适配性,避免低龄学生因认知不足导致技术滥用或过度依赖。
据介绍,为防范学生因过度依赖生成式人工智能而弱化独立思考能力,《使用指南》从制度规范、教学引导与角色定位等维度成立系统性防范机制。一方面,明确禁止学生直接复制人工智能生成内容作为作业或测验答案,并限制在缔造性任务中滥用人工智能,从源头上杜绝“代庖式”使用行为。另一方面,强化教师的引导职责,要求教师在教学实践中积极开展批判性思维训练,通过组织学生分析人工智能生成文本的逻辑缺陷、价值倾向及文化偏差,培养学生对技术输出内容的质疑精神与甄别能力,切实提升信息措置的自主性。同时进一步明确人工智能东西在教育场景中的辅助定位,强调其应用边界,始终坚守师生互动在常识传授、思维培养中的核心地位,确保技术赋能与教育本质有机统一。
此外,为切实保障学生隐私与数据安全,《使用指南》还要求构建覆盖数据安全、伦理审查、内容监管的全链条保障机制。具体包罗严禁师生在使用生成式人工智能东西时输入测验试题、个人身份信息等敏感数据,从源头上杜绝隐私泄露风险;各中小学校需成立健全生成式人工智能东西“白名单”制度,经严格审核评估,仅允许符合教育场景需求且数据安全合规的东西进入校园使用;教育行政部门将持续强化监管职责,对技术供应商的数据收集、存储、使用及传输等措置流程实施动态审查,确保其合法合规。 现阶段,如果学生直接复制AI内容,绝大部分情况下,老师还是能看出来的。
前两天我在毛子的国际教育学院,和一群来自中国的本科生一起上俄语课。其实我在这边读博士和教汉语都是英授,学俄语纯纯是因为我想学,毕竟在俄罗斯不会俄语实在是太不方便了。
上课的时候,老师布置了一道书写作业,要求我们用俄语写一篇短文,描述中国的历史建筑。写完了之后喊我们挨个念自己的作文。
咱们学语言的都知道,欧陆语言还是比较变态的,英语比起来就是弟中弟。也不知道发明俄语的人一开始是个什么路数,总之如今的俄语极其复杂。
阴阳性数变化就足够令人头昏脑涨了;动词变位犹如活了一千年的老太太的裹脚布一层一层又一层,剪不断理还乱;再加上名词形容词六格变化,真的很容易精神分裂。
更何况我们还是新手村初学者,每个人的文章都写的极其稀烂。这个时候,一位可爱的水灵灵的小同学拿出她写了整整两页纸的毫无错误的完美范文。
毛子老师让她老老实实地重写hh。
回到我的中文课堂,情况也是一样的。
我的毛子学生才大一,之前从来没有系统学过中文。我已经教了他们一个学期,现在他们的中文水平大概是HSK二级。
每次我让他们翻译和造句,只要看到四字成语,我马上就懂了,这家伙百分百用了AI。
不然,你指望一个“八”和“儿”都分不太清的中文小白,五分钟之内速通中华成语,还可以写出“街道上人声鼎沸”这样文采斐然的句子?
AI可以辅助,但永远无法替代,除非把AI芯片植我脑子里。 我的评价是:极度落后的教育理念在科技的洪流面前不堪一击。
ai都骑脸了,不考虑与ai共存的教学方法,提炼在ai时代下学生应该具备什么能力,还在玩a4纸禁这禁那的套路。
你知道问的题目都是废话,你也知道学生答的是废话。“窗帘是蓝色反映了作者什么心理”这种问题,只配ai来答。 倘若我将 AI 生成的内容背下来,再默写到作业纸上,阁下又该如何应对?
要是小孩从小就和 AI 聊天,平时行文风格都有股 AI 味,阁下又该如何应对?
我认为最有效的方案不是搞什么 AIGC 检测,而是别布置什么家庭作业了,让学生在学校里面完成练习就够了。家庭作业的效果是可疑的,PISA 成绩前列的芬兰就不怎么布置家庭作业。15 岁的芬兰孩子每周花 2.8 个小时做功课,而中国学生是 13.8 个小时,这显然是作业太多了。
以下内容摘自 @Thoughts Memo 汉化组的译文《家庭作业》家庭作业基于自学。然而,这并不意味着它高效或良好。大多数时候,它很糟糕。
家庭作业在大多数情况下有害的原因如下:
[*]材料通常是被强加的,而不是自主选择的。这违反了自我导向的原则
[*]家庭作业通常在晚上做,在错误的昼夜节律时间(昼夜节律因素)
[*]当孩子们开始做家庭作业时,他们通常已经在学校花了很长时间,已经筋疲力尽了(自稳态因素)
[*]太费力,工作量太大,学习速度过高,引发干扰而破坏先前的学习(见:论老鼠比受过学校教育的人更优越)
[*]违反学习的基本法则导致人们普遍讨厌学校教育,甚至讨厌学习(见:孩子为什么讨厌学校?)
PISA的相关性似乎表明,家庭作业对考试结果是有益的。然而,芬兰是一个很好的反面例子:家庭作业很少,但效果很好。
以下内容摘自 @Thoughts Memo 汉化组的译文《关于家庭作业存在的反思》学生在学校度过了大半天,回到家后还要做额外的家庭作业。静下心来想一想,这很奇怪。但更奇怪的是,很少有人静下心来思考为什么。
考虑到另外三个事实,家庭作业变得更奇怪了:
1. 家庭作业的负面影响众所周知。 比如让学生沮丧、疲惫、没有时间参加其他活动,以及可能丧失学习兴趣。许多家长会感叹家庭作业影响了他们与孩子的关系;他们也可能不喜欢逼孩子完成作业,但也担心他们可能会被别人指指点点,或是因为他们对作业不够上心,或者太过上心。
2. 作业的积极作用大多是虚幻的。 为了准备一本关于这个主题的书,我花了很多时间检查相关研究。研究结果令人震惊。首先,完全没有证据表明在小学或初中布置家庭作业对学业有任何益处。事实上,对于低年级学生来说,是否布置家庭作业(或布置多少家庭作业)与学习成绩之间甚至没有任何相关性 。在高中阶段,相关性很弱,而且在采用更复杂的统计方法后,相关性往往会消失。同时,也没有任何研究证实家庭作业能培养孩子的性格,或教给孩子良好的学习习惯。
3. 尽管作业毫无价值,但学生的作业还是越来越多。在过去的 25 年中,负担最重的是最年幼的儿童。对他们来说,证明作业积极影响的证据非常有限,甚至可以说根本不存在。
大多数老师时不时会决定,放学后应该继续某个课题,因为这样的作业很可能会带来有意义的学习,值得占用家庭时间——实际并非如此。在大多数学校,家庭作业并不只在适当和重要的时候才布置。恰恰相反,他们的出发点似乎是:「我们已经定好,孩子们每晚(或每周几次)都得做点什么。具体布置什么任务,以后再说。」
我从全国各地无数的人那里听到了家庭作业带来的沮丧感。看着孩子们书包里的作业如洪水般汹涌而出,家长们能让教师理解,这些作业的弊远大于利。而那些长期以来对家庭作业的价值心存疑虑的老师,则被家长施压。因为家长错误地认为课后作业少意味着老师对学生成绩不够重视。这些家长似乎认为,只要他们的孩子每天晚上有很多事情要做,不管是什么,那就一定有学习。
家长和老师需要的是能挑战传统智慧的行政人员的支持。他们需要的是能提出质疑的校长,质疑那些被当做论据的口号:家庭作业能连接学校和家庭(说的好像没有其它更有建设性的方式来建立这种联系似的!),或者是家庭作业能「强化」学生在课堂上所学的知识(这个词表示重复死记硬背的行为,而不是理解能力的发展),又或者是家庭作业培养了学生的自律能力和责任感(这种说法完全没有证据)。
最重要的是,校长需要帮助老师们认识到,在评估有关家庭作业(或其他政策)的决策时,最重要的标准是这些决策对学生的学习态度可能产生的影响。教育学教授 Harvey Daniels 表示:「家庭作业大多数时候只会让孩子们远离学习。」让我们面对现实吧:大多数孩子都对家庭作业感到厌烦,或者最多把它当作一项必须应付的任务。因此,即使家庭作业确实能带来其他好处,也需要权衡这些好处与其对孩子的学习热情所产生的负面影响。
<hr/>那么,一位深谋远虑的校长应该怎么做呢?
1. 自学,并与老师、家长和教育局的行政人员分享你所学到的知识。确保你真正理解研究的结论——缩减或取消家庭作业,并不会在学业或生活技能方面让孩子吃亏。决策应当建立在实事求是而非迷信俗语之上。
2. 重新思考标准的「作业政策」。老师被要求每天布置一定数量的家庭作业,或每周都布置作业(例如,每周二、周四布置 x 分钟的数学作业),这实际上是承认家庭作业并不是基于某个具体课程的需要,更不是根据每个学生的具体需求和时间安排。这样的政策为了追求可预测性而牺牲了深思熟虑的教学,不仅对学生有害,而且当这些政策由上级强制实施时,也伤害了老师。
3. 减少数量——但不要止步于此。很多家长对孩子们花在家庭作业上的时间感到不满,这是可以理解的。至少,确保老师安排的作业量不超过学区的参考标准,并且不要一直低估学生完成作业所需的时间。(正如一位母亲和我说:「如果只有最快的孩子能在 20 分钟内完成,那么宣称这是 20 分钟的作业量就是欺诈。」)然后,努力减少作业的数量,不论是否符合这些参考标准和期望,让家庭而不是学校决定学生晚上的时间安排。
然而,问题并不仅仅在于作业的数量。坦白说,有些作业,哪怕只花五分钟,对学生来说也是浪费时间。太多的一年级学生被迫从杂志里剪下以特定字母开头的单词。太多的五年级学生必须在图纸上给一长串的因数对涂色。太多的八年级学生每晚都要翻阅那些枯燥、内容过剩、由委员会编写的教科书,一章接一章地读。应该鼓励老师们思考,任何一项家庭作业是否真的能帮助学生深入思考重要问题。每份作业的背后,究竟有着怎样的教学哲学,怎样的学习理念?它是假设孩子们是意义的创造者——还是空容器?它是把学习视为一个主动还是被动的过程?是让学生与思想搏斗,还是盲目遵循指示?
4. 改变默认状态。仅仅减少作业数量或提高作业质量是不够的。我们应该改变学校对学生根深蒂固的期望。只有当某项作业真正对大多数学生有益时时,才要求他们把学校作业带回家。否则,他们应有自由决定如何支配课后时间。底线是:除非真正必要,否则不布置作业。当然,这颠覆了当前的默认状态——无论家庭作业的内容如何,都认为它是必要的——这种观点根本站不住脚。
5. 听取学生的意见。了解学生对家庭作业的看法,并征求他们的建议——比如可以发放匿名问卷。很多成年人不加探询,就假定家庭作业对学习有益,却从未真正了解学生自己的体验!学生真的认为家庭作业有用吗?有用或没用的理由是什么?哪种类型的作业更好?家庭作业如何影响他们的学习欲望?作业对他们的生活和家庭还有哪些影响?
6. 建议老师只布置自己设计的作业。在大多数情况下,学生只应该做老师设计的作业,而不是事先制作好的、一成不变的习题,或从教科书上复印的通用习题。此外,给全班学生布置相同的作业几乎没有意义,因为它不太可能对大多数人都有益。做这种作业,对于已经理解概念的学生来说,是在浪费时间,而对于还不理解的学生来说,则会慢慢失去信心。没有哪份完美的作业能激发每一个学生的学习兴趣,因为没有什么标准能够适应所有人。在真正需要布置作业时候,教师应根据学生的不同兴趣和能力设计多份作业。但是,与其给每个人布置相同的作业,不如不给任何人布置作业。
7. 让作业成为学生参与决策的机会。评估课堂质量的一个方法,是看学生在与自己学习有关的决策中的参与度。最优秀的教师都知道,学生是通过做决策来学会如何做出正确的决策,而不是仅仅遵循指示。学生对他们要学什么、在什么情况下学,以及如何(何时)评价他们的学习、教室如何布置、如何解决冲突等等,都应该有发言权。
教育的普遍规律,在家庭作业上同样适用。至少有两位研究人员发现,(根据不同的标准定义的)最出色的教师更倾向于让学生参与决定作业的内容,而不是直接告诉他们在家里要做什么。家长看到孩子的家庭作业后,第一个合理的问题应该是:「孩子们在决定如何完成、何时完成,以及是否真的需要在家完成这项作业上,有多少发言权?」
就家庭作业是否有益(以及为何有益)的讨论本身就很有意义。如果观点多样,如何处理大家意见不一的情况——是投票表决?还是继续讨论直到达成共识?或是寻求一个折中方案?——这个过程既能培养社交技能,也能促进智力成长。正是因为教师选择了提问而不是吩咐,成长才得以发生。如果你认为孩子们总是对家庭作业说不——或对任何需要努力的事情说不,那些经常与学生商量的老师们会对这种观点摇头否定。他们会告诉你,这是不对的。当学生感到被尊重,当他们觉得作业值得做时,他们多数都会热爱挑战。
反之,如果学生对家庭作业嗤之以鼻,或想方设法逃避作业,一般是因为他们的作业太多了,或因为作业布置得漫不经心、连篇累牍,或者仅仅是因为他们对作业没有发言权。即使是高质量的作业,如果学生感觉自己是「被动接受」,而不是「参与其中」,其益处也是有限的。
8. 帮助老师摆脱打分制。你的教师团队可能需要你的支持、鼓励和实际操作建议,以帮助他们摒弃作业检查或打分的老套路——其目的是强迫学生服从;转而采用新模式,鼓励学生之间相互解释和探讨自己的学习——他们对所读的书有什么喜欢和不喜欢的地方,他们有什么困难,他们想到了什么新问题。正如杰出的教育家 Martin Haberman 所见,最佳课堂上的家庭作业「不是为了检查——而是为了分享」。倘若学生们觉得,对于那些不会被搜集或记录的作业投入时间毫无意义,那么这并非是要我们设置奖惩制度、制造不信任的理由;这其实是在告诫我们,问题在于作业本身。
9. 实验。请那些不愿意重新思考长期以来对传统作业的依赖的老师试一试,看看在某一周或某一课程单元中,如果不布置作业会发生什么。当然,任何信奉家庭作业有益论的人,都应该愿意通过实验——暂停布置作业,来检验这一假设。暂停布置作业对学生的学习成果、学习兴趣、情绪状态以及课堂气氛有什么影响?学校同样可以试行一项新政策,比如我提议的改变默认状态,在全面实施之前,不妨先行试水。
<hr/>校长们的日子总是在一次又一次的突发事件中度过;他们要处理种种抱怨,抚慰那些受了伤的自尊心,协商出各种解决方案,力求让所有人都心满意足,并且尽可能让火车(或者说,公交车)按时发车。身处这样的岗位,面对可能动摇现状的新举措,往往很难抵挡住逃避的诱惑。特别是在当前这个「提高标准」和「更高要求」等说辞被用来为各种从愚蠢到不当再到吓人的实践辩护的时代,要有相当的胆量和决心来处理像家庭作业这样的问题。但无疑,校长的根本职责是为孩子们做正确的事,保护他们不受那些有害的规定和实践的伤害,这些东西之所以流传至今,不是因为它们有价值,而只是因为它们是传统。
对于那些为了做出合理之事,愿意打破常规的人来说,开启关于家庭作业的讨论,无疑是个绝佳的开始。
[如需更详细地了解此处讨论的问题——包括相关研究的全面引文清单,和对成功变革努力的讨论——请参阅作业谬论。]相关资料
大量文章和书籍声称家庭作业是有益的——或者认为家庭作业理所应当,不加质疑,只是机械地提供一些布置作业的技巧,或是教父母如何促使孩子完成作业。这里有一些资料,它们对这个话题上的传统观念提出了质疑,旨在激发有意义的思考和对话。
Barber, Bill. “Homework Does Not Belong on the Agenda for Educational Reform.” Educational Leadership , May 1986: 55-57.
Bennett, Sara, and Nancy Kalish. The Case Against Homework: How Homework Is Hurting Our Children and What We Can Do About It (New York: Crown, 2006).
Buell, John. Closing the Book on Homework: Enhancing Public Education and Freeing Family Time. (Philadelphia: Temple University Press, 2004).
Dudley-Marling, Curt. “How School Troubles Come Home: The Impact of Homework on Families of Struggling Learners.” Current Issues in Education 6, 4 (2003).
Hinchey, Patricia. “Rethinking Homework.” MASCD Fall Journal, December 1995: 13-17.
Kohn, Alfie. The Homework Myth: Why Our Kids Get Too Much of a Bad Thing (Cambridge, MA: Da Capo Press, 2006).
Kralovec, Etta, and John Buell. The End of Homework: How Homework Disrupts Families, Overburdens Children, and Limits Learning (Boston: Beacon Press, 2000).
Samway, Katharine. “’And You Run and You Run to Catch Up with the Sun, But It’s Sinking.’” Language Arts 63 (1986): 352-57.
Vatterott, Cathy. “There’s Something Wrong With Homework.” Principal, January-February 2003: 64.
Waldman, Ayelet. “Homework Hell.” Salon.com. October 22, 2005.
声明
Copyright 2007 by Alfie Kohn. Reprinted from Rethinking Homework and translated by Thoughts Memo with the author&#39;s permission.
Thoughts Memo 汉化组译制
感谢主要译者 Zero,校对 Shom、Jarrett Ye
原文:Rethinking Homework - Alfie Kohn
发表于 2007 年 1 月/ 2 月
作者:Alfie Kohn<hr/>创作声明:内容包含教育建议,国外经验仅供参考。 让老师用“肉眼”识别出AI生成的内容,实在是有点过于难为老师了。
如果用“肉眼”就可以精准识别出来AI内容,那也就不用搞出知网AIGC检测服务系统等一大堆AI检测工具让学生们瑟瑟发抖了。
关键是,如果这些“检测系统”能够精准的识别出来AI生成内容也就罢了,结果一个比一个拉跨,有人把《傲慢与偏见》贴给检测工具,结果ZeroGPT给出了73.9% AI-generated content的结论:
有人把圣经给OpenAI的AI Text Classifier进行检测,结果被认定为是AI生成的:
莎士比亚的麦克白,也被认为是AI生成的:
http://pic1.zhimg.com/v2-fb0cd24a28337efc922adc49260c8b38_r.jpg?source=1def8aca
所以我觉得如果相信这些基于AI的AI检测工具的话,恐怕还不如让老师进行“肉眼”识别,“误判率”可能还能略低一些。
不过跟“狡猾”的大学生比起来,中小学生相对还是“单纯”一些的,所以我觉得最近不少人在研究的“加水印”方法或许可以一试。
假设原始文本是:
&#34;The quick brown fox jumps over the lazy dog today.&#34;
每隔5个词进行一次标记:
比如上面那句话的第5个词jumps,第10个词today,分别标记出来
然后用进行替代
替代后,句子就变成了:
&#34;The quick brown fox over the lazy dog &#34;
然后用大模型对这句话进行预测:
比如DeepSeek看到的句子是:&#34;The quick brown fox over the lazy dog &#34;
DeepSeek预测的结果可能是:第一个 → &#34;leaps&#34; (基于上下文)
第二个 → &#34;quickly&#34;(基于上下文)
所以我们就可以得到一句被打上了水印的句子:
&#34;The quick brown fox leaps over the lazy dog quickly&#34;
当我们用相同的算法对文本进行检测时,同样会在第5个和第10个词的位置,用进行替换,又变成了:
The quick brown fox over the lazy dog
然后我们用DeepSeek对这个句子进行预测:
DeepSeek看到:&#34;The quick brown fox over the lazy dog &#34;
DeepSeek预测:第一个 → &#34;leaps&#34; (与水印文本中的词相同!)
第二个 → &#34;quickly&#34;(与水印文本中的词相同!)
完蛋!露馅了!
所谓的加水印过程大致就是这样的,我觉得可以总结为:
大模型知道自己说话是啥样的,把一些比较有”特色“的位置挖空,然后看看你写的句子,和它自己准备写的句子是不是完全一样。如果用词完全一样,那完了,实锤,AI生成的。
但是现在的小孩都很聪明,整个Paste之后,谁都知道这样很危险,于是在句子的前面或后面加几个字或减几个字,也就是造成词语的“偏移”。
可是吧,这种做法也被提前想到了,对于“偏移”同样有办法进行检测。
比如一个句子:
&#34;The cat sat on a mat and the dog jumped fast&#34;
“聪明小孩”在句子前面加上两个词,“干扰”这个句子:
&#34;Hello world The cat sat on a mat and the dog jumped fast&#34;
然后算法会尝试所有偏移量,比如说5个偏移量进行检测:
偏移量0(从第0个位置开始,每5个词检查),匹配情况:
[*]&#34;Hello&#34; ≠ 原始第1个词&#34;The&#34; ❌
[*]&#34;sat&#34; = 原始第5个词&#34;sat&#34; ✓
[*]&#34;dog&#34; = 原始第10个词&#34;dog&#34; ✓ 匹配率:2/3 = 66.7%
偏移量1(从第1个位置开始,每5个词检查),匹配情况:
[*]&#34;world&#34; ≠ 原始第1个词&#34;The&#34; ❌
[*]&#34;on&#34; ≠ 原始第5个词&#34;the&#34; ❌
[*]&#34;jumped&#34; = 原始第10个词&#34;jumped&#34; ✓ 匹配率:1/3 = 33.3%
偏移量2(从第2个位置开始,每5个词检查),匹配情况:
[*]&#34;The&#34; = 原始第1个词&#34;The&#34; ✓
[*]&#34;a&#34; = 替换后的第5个词&#34;a&#34; ✓
[*]&#34;jumped&#34; = 替换后的第10个词&#34;jumped&#34; ✓ 匹配率:3/3 = 100%
完蛋,当偏移量达到2时,又露馅了!
虽然这样仍然存在“误判”的可能性,但是我想能够完全copy-paste作业的小孩,应该不会有耐心整个重写句子,也不会有“财力”请人帮忙降低AIGC率,所以被发现的概率还是很大的。
如果有小孩能够从检测原理的方向进行“破解”,那我觉得可以大大提升小孩的“信息技术”水平,这个“斗智斗勇”的AI检测过程也算是发挥了它的价值。 现在看到ai检测的问题就想笑。
现在不是毕业季么,今年好多学校都拍脑袋上了aigc检测。结果一查一个不合格。
怎么办?想办法降重呗。
结果好多人本来检测30+,降重后再测50+。。。 有个老师不信邪,自己亲手写了一段摘要传上去,全被判定为ai。导致有些同学不敢用理性客观的语气说话,楞往论文里查了很多像是逗小孩一样语气的话才过关,比如“这个问题应该怎么思考呢?原来我们应该这样想blabla”,看得差点笑死。
而且学校只给一次查询机会,后面再查是要收费的,很难让人不怀疑初衷到底是什么。
页:
[1]