搜吧 - 智能搜索
  • 两位AI考生今年走上高考考场,而且数学已经考及格了 | 雷峰网

    “AI-MATHS”之父林辉是清华大学苏研院大数据处理中心主任,同时也是该中心智慧教育事业部从2013年开始技术孵化的成都准星云学科技有限公司CEO。除了这次应试数学的AI-MATHS机器人,准星云学还研发了准星智能评测机器人(即准星智能评测系统),能对学生答案正误、错误知识点、错误原因进行智能判定。准星云学还亮相2016年“十...

  • 最后一场考试:当最强AI模型遇上专家级学术难题会发生什么? - 哔哩...

    三、AI在不同学科的表现:数学依然是最大挑战 当AI系统面对涵盖十几个学科领域的专家级问题时,它们在不同领域的表现差异颇为有趣。这种差异就像是观察一个全才学生参加各科考试时的强弱分布,能够揭示AI系统在知识结构和推理能力方面的特点。 数学依然是AI系统面临的最大挑战。这个结果或许让很多人感到意外,因为在普通...

  • 这场考试里,北京大学的本科生打败了AI!北大团队打造硬核化学评测题库SUPERChem,174名化学学霸与GPT、Gemini、deeppseek等顶尖AI同场竞技,500道防作弊高难度化学试题,暴露AI科学推理短板。 SUPERChem的诞生,填补了化学领域多模态深度推理评测的空白。 据悉,团队发布这项成果,并非为了证明AI的短板,而是为了推动它走得更远...
  • 174名北大学生迎特殊考试:对决AI 探索科学推理边界_新闻频道_中华网

    近日,北京大学化学与分子工程学院联合北大计算中心、计算机学院、元培学院团队发布了最新成果SUPERChem。他们以一套“北大试卷”为标尺,冷静丈量着AI在科学推理上的真实边界。 打开SUPERChem的题库,一种压迫感扑面而来。晶体结构的精细解析、反应机理的深度推演、物化性质的定量计算……这500道题目并非来自网络上随手可得的...