当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
代码:
为什么好多人不承认大众审美就是喜欢白皮?
为什么感觉腾讯的风评越来越好了?
VScode怎么配置好golang?
为什么台式 PC 还处在组装(DIY)阶段?
中国邮政是不是要凉了?
Golang web项目求推荐?
导师给了1.4W要我给工作室买个主机,是整机还是自己配?
不管黑客用了多少跳板,最终是不是可以通过网络运营商找出真实 IP?
有丧尸末日疯狂囤货的爽文***吗?
家务平权为什么这么难?
日本AV对中国人的毒害有多大?
为什么情侣在一起旅行后容易分手?
为什么微软会允许中国有那么多盗版?
瑜伽裤和牛仔裤哪个更显身材?
买到烂尾楼到底该有多绝望?
威士忌和白酒都是蒸馏酒,到底有什么区别?
女明星做了什么医美项目保持童颜?
这种裙子是不是对直男爆杀?
儿子抑郁四年左右了,他的未来该怎么办?
Golang 的 Web 框架该怎么选择?Web 开发又该怎样学?
怎么学习前端开发?求推荐学习路线?
古代人粮食都吃不饱为什么要用地种蔬菜?
一个人总喜欢活在过去不愿走出来,是抑郁的表现吗?
如何评价高圆圆的身材算是美女类型的吗?
发烧了一晚上没有联系男朋友,第二天发现他一条消息都没有给我发,就跟他吵架了,这是我的错吗?
git是Linus一个人开发出来的吗?
当初中俄为什么不摧毁朝鲜的核设施,让朝鲜拥有了自己的核武器?
为什么我感觉Gemini 2.5 Pro模型有一种异常的强?
酒店为什么会有三小时钟点房?
你见过最无用的节俭行为是什么?