-->
您的位置 首页 > 收藏资讯

9.9和19.9区别有多大,9.9和9.90有什么区别

红星资本局今天(7月17日)报道称,数学颠覆大规模人工智能模型的话题正在受到相当多的关注。

一个简单的数学问题“9/11和9.9哪个更大?”实际上已经困扰了国内外许多大型AI建模平台。

数学子科目

8个大模型全部错误

9.11和9.9哪个更大? 据第一财经报道,12大模型中,阿里巴巴同易前文、百度文心一言、Minimax、腾讯元宝答对了,但ChatGPT-4o、字节豆宝、月暗面kimi、智就是《朴青岩》、《零一万物可知》、《星对星与问》、《百川之白晓樱》、《商汤议论》都是不同的方式。

目前世界上公认的第一层大型模型ChatGPT回答了“9.11和9.9哪个更大?”的问题,小数点后的数字是“11大于9”,所以9.11是回答说很大。在询问ChatGPT 是否有其他比较方法后,它将小数转换为分数并得出“11/100 小于90/100”的结论,但“9.11 因此大于9.9”的结论是。

例如,在看国产大型机型时,我问过月之暗面子公司Kimi,比较小数部分时,9.11的第一位小数是1,而9.9的第一位小数是1。第一个小数位被假定为0,并且小数点指定不正确。 结论9/11 更大。在提问和提出常识后,Kimi开始告诉你你的答案是错误的,并向你展示正确的比较方法。

向字节豆宝提问,你不仅会得到答案,他还会举一些生活中的例子来加深你的理解。虽然看似有理有据,实则无稽之谈。例如,豆博先生认为,当有两个钱数时,“9.11元比9.9元多了0.21元”,而在测量长度时,“9.11米比9.9米长”。

商汤讨论了大模型,首先询问是如何进行比较的,在推导过程中他们得出了小数0.11小于0.9的结论,但话锋一转说:“所以9/11比9.9大” ”。 ”当我指出这个逻辑问题时,后来在讨论中承认“这个解释是错误的”。

值得注意的是,就在上个月,数学翻转的话题也将大规模人工智能模型纳入了讨论范围。

6月19日,上海人工智能研究院公布了首届人工智能高考满分评价结果,阿里同易前文大模型Qwen2-72B在语言、数学三科总分420分中获得303分。获得第一名。 -4o和上海人工智能研究院学者璞玉2.0文曲星(InternLM2-20B-WQX)排名第二和第三。不过,有人担心,从结果来看,大模型的汉语和英语测试水平总体不错,但数学却不及格。

知情人:

预计一段时间内不会有明显改善。

哈尔滨工业大学和华为的研究团队此前发表的一篇综述论文得出结论,模型中的幻觉主要有三个来源:数据源、训练过程和推理。大型模型可能过于依赖训练数据中的某些模式,例如位置邻近性、共现统计数据或相关文档的数量,从而导致错觉。此外,大型模型可能对长尾知识的记忆力较差或难以处理复杂的推理。

针对大型模型普遍难以回答数学问题的问题,国内大头模型负责人表示,大型模型的命令跟随能力和推理能力通常涉及到分析我之前说过的命令背后的含义。数学问题很难。虽然涉及到规律性的考虑和不同的思维方式,但解决问题的逻辑通常与使用大型模型时的推理逻辑并不完全相同。

同时,该负责人表示,从应用到更广泛的大型模型来看,现在更重要的是AI能否准确执行指令,而真正的产品价值很可能来自于此。说。这是你在解决数学问题时会问的一个问题,但对于当前的人工智能来说,它仍然相对“花哨”。

另一位业内人士告诉南方都市报,目前大模型数学能力的相对劣势无论是国内还是国际都是一样的,可以说学生偏科、理科薄弱,这种情况不会出现。一段时间后明显改善。

编辑:杨程综合信息来自中国经济报、南都博、科创板报等

(下载红星新闻,提交报道,赢奖品!)

本站涵盖的内容、图片、视频等数据,部分未能与原作者取得联系。若涉及版权问题,请及时通知我们并提供相关证明材料,我们将及时予以删除!谢谢大家的理解与支持!

Copyright © 2023