图说:不同大模型回答“13.8和13.11哪个大?”13.8和13.11哪个大? 综艺节目的选手排名,竟让一道本不该成为争议的“小学数学题”,在网上掀起讨论。 不仅部分人类搞不清楚,“聪明”的大模型也洋相百出——简单的常识题对它们来说还是有难度!
7月13日,最新一期的《歌手》公布排名:孙楠得票13.8%,外国歌手香缇莫得票13.11%。这引发了一些网友对排名的质疑。有网友认为13.11%大于13.8%,因此,香缇莫的得票率比孙楠高。随后,关于13.8%和13.11%大小比较,一度成为了网络上的热门话题。
2024年高考已顺利落幕,让大模型写高考作文题已不稀奇,大众通常认为大模型更擅长文科,不擅长进行数学计算和逻辑推理。当AI遇上高考数学题,大模型化身为“考生”答数学题,会交出怎样的答卷?我们选取了4名有代表性的大模型“考生”,分别是九章大模型、星火大模型(v3.
9月13日,OpenAI发布新模型o1,此前被网友诟病的大模型比较不出9.11和9.9大小的问题,终于在新版大模型中得到了正确结论。 经过测试,o1-preview依旧给出错误答案,认为9.11更大。而o1-mini经过短暂“思考”,纠正了此前错误:“抱歉,上次的回答有误。9.
红星资本局7月17日消息,今日,AI大模型在数学上的翻车话题引发不小关注。一道“9.11和9.9哪个大”的简单数学题,竟困住了海内外一众AI大模型平台。数学偏科8个大模型全答错9.11和9.9哪个更大?