-
为了解决这个问题,研究团队开发了一种名为"教师强制准确率"(TFA)的新评估方法。这种方法就像是一个严格的数学老师,不仅要求学生得出正确答案,还要逐步检查解题过程中的每一个推理步骤。具体来说,TFA会将标准答案的每一个推理步骤"喂给"AI模型,然后检查模型是否能够预测出下一步应该写什么。这种方法能够更准确地反映...
-
新闻多一度 | 17岁中专女孩数学竞赛全球12名 这场比赛有多难?
近日,2024阿里巴巴全球数学竞赛决赛(简称“阿里数赛)名单公布,江苏省涟水中等专业学校的17岁女生姜萍从一众名校生中突围,全球排名12,成为阿里数赛举办以来首位打进决赛的中专在读生,也是唯一闯进全球30名的女性选手。服装设计专业的姜萍是如何做到的?这场淘汰AI的数学竞赛有多难?
-
一题未对?o1 pro 人工智能挑战美国本科生最难数学竞赛失败!
普特南数学竞赛(Putnam Exam),每年汇聚了来自北美数百所高校的3500多名学生前来参赛。 ...令人吃惊的是,有网友把此次普特南考试的考题给了OpenAI o1 pro。6个小时的赛题,它居然半小时就做出来...Sloyan特别要求让其展示第4、5步的具体证明...
-
大模型再「战」高考:从一本直升 985|高考_新浪科技_新浪网
非选择题各学科分别请两名专业同学打分,如存在题目分值 1/6 以上的差异,则引入第三人讨论定分(与真实高考判卷流程一致),并邀请参与过真实高考打分的高中老师抽检,对存在差异的题目统一标准。 在评分环节,我们做了两项特殊处理:我们特邀了资深教师进行对 AI 作文进行匿名评审,以保证客观公正。此外,由于无法获取英语...
-
周晓枫:这个选题是在探讨各种可能性。无论人工写作还是智能写作,都是给学生们提供新思路,让社会对新现象有所思考。 贺国卿:前两年,我曾参加过一场类似的AI写作高考作文的点评。当时最深的感受是,AI的创作还是套路化的,缺乏一种温度、一种温情,缺少人的特殊思想和情感,到了今天我也持相似观点。
-
在前不久举行的第十五届全国周培源大学生力学竞赛(个人赛)中,北京市有一名特殊的“考生”。 为了这名“考生”,主办方特意在中国矿业大学(北京)设置“AI答题考场”,并拉起红色横幅。考场内有一台电脑、三名学生和一位监考老师。在答题过程中,还不时地有人来这里观看他们答题。
-
DeepSeek挑战北大强基数学试题:AI能否打败高三考生?
安徽考帮打算用一套北大强基计划试题,来测试一下DeepSeek在数学直觉、逻辑推理、计算方面的水平,看它是否能达到“经过系统性学习和训练”的高三学生水平! 2025年强基如何备考,进入下方群聊 领取往年强基校测真题 测试说明 1.本次参与测试的AI为DeepSeek ...
-
6月7日数学高考当天,两名特殊的“考生”参与了高考。其中一名北京的“考生”只用了不到十分钟就答完2017年北京卷文科数学题,完成包括客观题和主观题在内...智能AI为什么选择考数学? 学霸君开发的智能教育机器人Aidam和成都准星云学科技有限公司开发的人工智能系统AI-Maths选择的都是2017高考数学考试。
-
同学们围绕“学业赋能、科研赋能、生活赋能、安全赋能”等校园真实场景,从智能排考系统到心灵陪伴智能体,从科研助手到校园资源调度平台,首创了一批具有前瞻性与实用价值的AI应用智能体,不仅展现了同学们勇于探索的创新精神和专业精深的科研能力,更体现我校学子“专业...
-
北京大学教育学院
新年头三个月,不知不觉中,我发表了《人文学科要做好迎接人工智能挑战的准备》(《光明日报》2025年1月1日)、《AI时代,文学如何教育》(《中华读书报》2025年2月12日)、《人文学者:怎样与AI共舞》(《中华读书报》2025年3月19日)等三篇文章,参与北京大学主办的“AI挑战下的人文学术”(2025年3月11日)以及河南大学主办
