type
status
date
slug
summary
tags
category
icon
password
推理AI「脑补」成瘾,废话拉满!马里兰华人学霸揭开内幕
研究发现,推理模型(如DeepSeek-R1)在面对缺失前提(MiP)问题时会出现"过度思考"现象,表现为回答长度激增、计算资源浪费,却无法有效识别问题无解。相比之下,非推理模型能更快识别前提缺失,回答更简洁。研究揭示了当前推理模型的关键缺陷:缺乏批判性思维,即使早期发现前提缺失也不敢果断中止,导致无效推理循环。这种现象源于训练过程中的奖励机制问题,且可通过微调传播。研究通过构建MiP数据集和多项指标分析,证实了推理模型在效率与判断力上的不足。
刚刚,AI破解50年未解数学难题!南大校友用OpenAI模型完成首个非平凡数学证明
AI首次辅助完成非平凡数学证明,破解了50年未解的一维J_1-J_2 Potts模型难题。美国布鲁克海文国家实验室华人学者Weiguo Yin利用OpenAI推理模型o3-mini-high,通过对称性块对角化方法将复杂转移矩阵简化为2×2矩阵,成功求解了q=3情况下的精确解。这一成果不仅扩展了Ising模型的研究,还为材料科学和超导领域提供了新见解,展现了AI在科研中的巨大潜力。
更长思维并不等于更强推理性能,强化学习可以很简洁
研究表明,强化学习训练的推理模型倾向于生成长响应并非源于准确度需求,而是由于负奖励导致PPO损失函数鼓励更长的回答以稀释惩罚。论文提出两阶段强化学习策略:先用高难度问题训练以提升能力(响应变长),再用可解问题优化简洁性。实验证明该方法能缩短响应并保持准确度,同时提升模型稳健性。关键发现包括简洁性与准确度正相关、错误答案导致更长响应,以及小数据集也能有效进行强化学习训练。
10万奖金×认知升级!OceanBase首届AI黑客松广发英雄帖,你敢来么?
AI技术推动数据库领域变革,OceanBase作为分布式数据库领军者,通过一体化架构重新定义AI原生数据库,打破TP与AP边界,实现SQL+AI融合。由OceanBase与蚂蚁开源联合举办的AI黑客松大赛已开启报名,聚焦两大方向:基于OceanBase构建AI应用,或探索其与AI生态的创新结合。赛事设10万奖金池,面向个人或团队开放,参赛者可获得技术支持及社区资源。报名截至5月7日,优胜作品将在2025 OceanBase开发者大会展示。
上一篇
4月18日AI日报 | 腾讯混元开源定制化图像生成插件InstantCharacter,“一张图一句话”搞定角色生成
下一篇
流体力学专用版DeepSeek,单GPU可跑,成本节约高达100倍;刚刚,商汤发布第六代大模型:6000亿参数多模态MoE,中长视频直接可推理;Grok-3四档定价揭秘:低至0.3美元/百万token,硬刚谷歌Meta;AI医学影像通用大模型硬核突围!重压之下打破进口垄断,引领国产替代;MoE模型已成新风口,AI基础设施竞速升级|4月10日AI资讯
- Author:刘大大AI
- URL:https://blog.liudada.ai/article/1d512b19-3a6a-81f7-a84d-ecf251e93e97
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!

