两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
两年前,GPT-4才出来的时候,大家纷纷给大模型出的题目是小学奥数,什么鸡兔同笼,都会有一定错误率,那时候人看大模型,就像看个傻子。
一年前,GPT-4o来了,模型变小了,性能提高,小学奥数以及普通的中考题正确率大幅度提高,但是中考的解答题仍然不会做。
半年多前,o1出现,首先提供的还是o1-preview和o1-mini,这两个模型已经能做中考解答题了,接下来只剩高考大题做不了。
然后今年,o3、o4-mini、gemini 2.5 pro……终于…。
坦白局…你们的冬天真的都不穿内衣啊?是这样的,今天不小心碰到...
2025-06-21阅读全文 >>看到这个题目,忍不住想吐槽一下 2年前受虚拟化潮流影响,将家...
2025-06-21阅读全文 >>当游戏中的某个角色过于强势时,通常会推出一个更强的角色以削弱...
2025-06-21阅读全文 >>一天5000枚啊,我给你算个账。 我就给你一枚火箭弹算一吨...
2025-06-21阅读全文 >>Vulkan可以为Windows Wow64转译专门加扩展来...
2025-06-21阅读全文 >>