资讯
近年来,大型语言模型(LLMs)在复杂推理任务中展现出惊人的能力,这在很大程度上得益于过程级奖励模型(PRMs)的赋能。PRMs 作为 LLMs 进行多步推理和决策的关键「幕后功臣」,负责评估推理过程的每一步,以引导模型的学习方向。
机器之心联合多个合作伙伴,成功举办云帆・ICLR 2025 AI Talent Meetup、CVPR 2025 论文分享会、NeurIPS 2024 论文分享会、ACL 2024 AI Talent ...
转眼之间,时间已来到 7 月,AI 领域依旧保持着快速发展的趋势。新的研究不断被推出,尤其是在视频生成、自主智能体等方向,多项成果相继刷新 SOTA,引发广泛关注。在这一背景下,作为自然语言处理领域最具影响力的顶级会议之一,ACL 2025 ...
Evaluation Agent 提出了一种高效、灵活、可解释的视觉生成模型评估新范式。它突破了传统评估方式的限制,能够根据用户需求动态分析模型表现,为生成式 AI ...
ACL 2025投稿破纪录,竞争激烈高分被拒 ACL 2025录用结果新鲜出炉,8000多篇总投稿量破纪录。今年竞争异常激烈,高分被拒者一大片,还有创新论文因 ...
该研究系统性评测了 LLMs 反思技术的失败,发现这种现象在多个 LLMs、多种任务上广泛存在,甚至先进的推理模型(ChatGPT o4-mini-high)在基本事实问题(「Is Earth ...
北京时间7月25日,据记者Anthony Slater报道,勇士对自由球员德安东尼-梅尔顿和赛斯-库里表达了兴趣。
当前正在显示可能无法访问的结果。
隐藏无法访问的结果