两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
代码:
为什么柬埔寨边检只收取中国人小费?
预测一下,下一次阅兵会出现什么武器震惊世界?
vue + tsx 的开发体验能追得上 react+tsx么?
请问您见过最惊艳的sql查询语句是什么?
WebSocket 是什么原理?为什么可以实现持久连接?
为什么大家不再提星链了(包括外网)?
能够自己一个人创业的全栈web码农fullstack developer要会哪些技术?
为什么说耿直的人更容易吃亏?
怎么向老婆简单解释nas的用途?
前端初学者如何学习css及页面布局?
为什么年轻的肉体让人沉迷?
00后比90后少了4700万,大家对生孩子为什么越来越抗拒?
非计算机专业,好奇为什么会出现“程序依赖bug运行”的情况?
商业史上有哪些降维打击的经典案例?
jwt的设计合理吗?
儿子抑郁四年左右了,他的未来该怎么办?
你们的相册里是否有一张充满遗憾的照片?
你身边的癌症患者都是怎么发现自己得癌的?
中国是不是最应该复制星链的国家?
为什么负荷那么大的腰部力量训练的人不会受伤,长期无载荷久坐的人会出现腰肌劳损?
人死了以后意识去哪了?
新买了一台nas,第一个月下载20t+,上传5+,不会被网警盯上吧?
NAS明明没那么好用,为什么还有那么多人坚持选择使用?
女生真正的完美身材是什么样子?
成龙是真自私还是不会捧人?
有一双超级大长腿是什么感觉?
为什么个人需要公网ip?
财务学vba还是sql?
为什么 Mac 对游戏支持这么差?