2025-04-09 08:42:35 互联网
近期,据日经新闻披露的一项联合研究成果显示,中美两国的新型生成式人工智能(AI)已经展现出令人瞩目的学术能力,成功跨越了日本顶尖学府——东京大学理科3类入学考试的门槛。这一突破性进展是通过对比测试美国OpenAI的“o1”模型与中国AI初创企业DeepSeek的“R1”模型得出的。
测试内容涵盖了2025年度的东京大学入学考试科目,由AI初创公司Life Prompt提供答案输出,并由知名预备学校河合塾的专业讲师进行评分。结果显示,在两个基础模型的表现中,o1获得了374分,R1紧随其后,取得了369分,均超过了东大理科3类合格的最低分数线368.7分。
值得注意的是,尽管R1在理科1类和理科2类的共通考试中未能达到合格线,但在其他类别,包括文科在内,它与o1均成功“合格”。这一表现不仅展示了AI在跨学科应用上的潜力,也反映了其在学术评估中的广泛适用性。
在具体的考试科目中,英语成为了AI模型的强项。o1和R1在英语部分的得分率均超过了75%,河合塾的英语讲师久恒秀雄对此评价道:“这两个模型在英语表达上几乎没有单词和语法的错误,其水平远远超过了东大考生的平均水平。”
然而,在数学科目上,尽管AI模型能够正确解答出不少最终答案,但在图形处理和论证问题上却频繁出现论述错误和说明不足的情况。在满分为120分的理科数学考试中,o1得了38分,R1得了49分,这一成绩显著低于合格者的平均分。负责数学评分的香坂季京讲师指出:“AI在数学论证上的表现还有待提高。”
对于这一研究成果,自2011年起便致力于“机器人能否进入东京大学”项目的国立信息学研究所新井纪子教授给予了高度评价:“这是AI成长历程中的一个重要里程碑。然而,我们也必须认识到,AI有时会给出令人困惑甚至错误的答案。因此,培养能够正确判断并熟练使用AI输出的人才显得尤为重要。”
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表本站立场。文章及其配图仅供学习分享之
相关资讯
HotMeta 新旗舰 AI 模型 Llama 4 Maverick 测试成绩遭质疑,被指针对性优化04-09
Hot特斯拉超充站突破2000座,全国省市100%覆盖,充电还难吗?04-09
Hot蓝莓听书手机版下载-蓝莓听书手机版免费下载v1.204-09
Hot英伟达RTX 5060 Ti显卡跑分曝光,性能如何引发热议!04-09
Hotvivo 4月21日盛大发布:X200系列手机携手平板、手表新品来袭!04-09
Hot雅迪华宇电池:技术革新+服务升级,铅酸电池行业迎来新变革?04-09
Hot《inZOI》私人剧场房间分享04-09
Hot巫师三最全女性攻略-巫师三全女角色攻略04-09
新品榜
热门
2025-04-08 19:03:20
节奏狂潮,大师级体验——节奏大师官方正版下载安装全攻略
04-08火影ol,鬼鲛鲛肌技能深度解析
04-08西游记张纪中版,重温经典,再造传奇
04-08我的世界,石砖楼梯的匠心之造
04-08火影忍者OL忍者考试雷主100关,挑战巅峰,谁与争锋!
04-082020花灯攻略,点亮你的游戏之旅,让你成为花灯大师!
04-08地震时被困在室内正确的自我保护动作是 蚂蚁庄园4月3日答案早知道
04-08蚂蚁新村4月2日答案最新 4月2日蚂蚁新村每日一题答案
04-08抖音网页版入口在哪-抖音网页版入口地址
04-08