3.11和3.8为什么ai会算错

资讯

13.8和13.11哪个大？大模型竟然开始“一本正经地胡说八道”……
图说：不同大模型回答“13.8和13.11哪个大？”13.8和13.11哪个大？综艺节目的选手排名，竟让一道本不该成为争议的“小学数学题”，在网上掀起讨论。不仅部分人类搞不清楚，“聪明”的大模型也洋相百出——简单的常识题对它们来说还是有难度！
新民晚报
2评论
AI为何对得很高级、错得很离谱？数理逻辑、常识感与心灵
（图文无关）无论科技怎样发展，还是让AI拥有智能，人类坚守心灵吧。（人民视觉/图）AI来了，人类都要失业了！甚至AI要将人类消灭了！很多媒体喜欢这样炒作，艺术家也喜创作这类科幻。
南方周末
这道小学数学题 AI竟集体答错
7月13日，最新一期的《歌手》公布排名：孙楠得票13.8%，外国歌手香缇莫得票13.11%。这引发了一些网友对排名的质疑。有网友认为13.11%大于13.8%，因此，香缇莫的得票率比孙楠高。随后，关于13.8%和13.11%大小比较，一度成为了网络上的热门话题。
齐鲁壹点
Python 3.11正式版来了，比3.10快10-60%，官方：这或许是最好版本
2020 年 1 月 1 日，Python 官方结束了对 Python 2 的维护，这意味着 Python 2 已完全退休，进入了 Python 3 时代。
机器之心Pro
11评论
deepseek比较3.9与3.11的大小
今天比较火爆的就是deepseek比较数字大小，3.9与3.11的大小，什么版本都有。看来网络的东西，还真不可信，还得自己去实践一下。
雪松001
似乎一夜之间，AI就攻陷了数学
（视觉中国/图）随着GPT热潮的不断发展，包括ChatGPT在内的大型语言模型（Large Language Model；LLM）开始逐渐进入各种原来被认为是人类智力活动专属的领域当中。
南方周末
212评论
当AI遇上高考数学题，4个大模型“考生”“成绩单”出炉
2024年高考已顺利落幕，让大模型写高考作文题已不稀奇，大众通常认为大模型更擅长文科，不擅长进行数学计算和逻辑推理。当AI遇上高考数学题，大模型化身为“考生”答数学题，会交出怎样的答卷？我们选取了4名有代表性的大模型“考生”，分别是九章大模型、星火大模型（v3.
新京报
6评论
一道小学奥数题4个AI平台答案不一，专家回应
“给娃儿辅导奥数题，问了多个AI平台，每个答案都不一样。”近日，重庆家长刘先生向上游新闻记者反映：同一道奥数题，百度、阿里云、今日头条等国内4个主流AI大模型平台，竟然给出了不同的答案。
齐鲁壹点
9.11和9.9哪个大？AI终于会答了
9月13日，OpenAI发布新模型o1，此前被网友诟病的大模型比较不出9.11和9.9大小的问题，终于在新版大模型中得到了正确结论。经过测试，o1-preview依旧给出错误答案，认为9.11更大。而o1-mini经过短暂“思考”，纠正了此前错误：“抱歉，上次的回答有误。9.
新黄河
究竟｜9.11比9.8大？大模型们为何会在小学数学题上集体翻车
万亿参数大模型竟然回答不了小学数学题？最近，面对9.11和9.8哪个大的问题上，一波大模型集体翻车了。7月17日，澎湃新闻记者实测13个主流大模型，询问9.11和9.
澎湃新闻
42评论
9.11和9.9哪个大？简单数学题8家AI大模型平台都翻了车
红星资本局7月17日消息，今日，AI大模型在数学上的翻车话题引发不小关注。一道“9.11和9.9哪个大”的简单数学题，竟困住了海内外一众AI大模型平台。数学偏科8个大模型全答错9.11和9.9哪个更大？
红星新闻
6评论
简单算术题难倒主流大模型大模型偏科严重
本报记者李玉洋上海报道近日，音乐综艺《2024歌手》两名选手“13.8%和13.11%的得票率谁高”的话题吸引关注。该话题不仅暴露了一些网友堪忧的数学水平，也让大模型集体“扑街”。
中国经营报

加载更多

视频

在线举报