两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
代码:
洲际导弹能打到任何地方,为什么还需要轰炸机?
脸与身材不符是种怎样的体验?
为什么小男孩小时候要比小女孩难养好多?
英伟达 RTX 5050 笔记本显卡跑分曝光,该显卡有哪些亮点?
两条宽带是否可以nas的外网访问速度?
黄金,今年会达到怎样的高度?
为什么中国刀在国际上不如日本刀出名?
做个web服务器,gin框架和go-zero怎么选?
如何评价Cursor?
为什么觉得 Rust 难上手,尤其是生命周期?
为何本田不给我们2.0T的雅阁,真的是有钱不赚吗?
PHP现在真的已经过时了吗?
为什么情侣在一起旅行后容易分手?
分享一下你用过好用的开源项目有哪些?
NAS存储那么好,你想过购买它吗?哪些NAS值得推荐?
PHP和Node.js哪个更爽?
如何评价前端组件库shadcn/ui?
华为 HDC 发布 HarmonyOS 6 开发者 beta 版对应用开发者和鸿蒙生态有哪些影响?
Docker 如何搭建 Jenkins 构建环境?
苹果为什么要给每代MacOS起个名字,真以为人们记得住分得清吗?
go为了编译速度减少了很多编译优化?为什么不能提供优化编译模式来提升运行效率?是太懒还是另有隐情?
为何小米玄戒一出手便是麒麟终未达到的高度?
海贼王为什么现在被全网黑?
在韩国生活有什么体验?
女生被踢裆也会很疼吗?
家用小型服务器用什么系统比较好呢?
你为什么对kotlin失去好感?
我是新手想养鱼,预算不超过200。有什么好的建议或者禁忌吗。?
想深入学习网站后台技术,有哪些建议?