资讯
OpenAI 宣布,他们的人工智能模型,在世界最顶级的数学竞赛(IMO)中,考出了相当于金牌的成绩。 这本该是展示 AI 技术实力的一个高光时刻,没想到,消息一出,庆祝的香槟还没开,全网的口水仗就先打了起来。
就在全球科技圈还在议论OpenAI抢跑宣称其内部模型拿下IMO金牌之际,真正的“官方认证”王者来了。谷歌DeepMind刚刚发布重磅博客,宣布其搭载了 “深度思考”(Deep Think) ...
就在本周一,谷歌宣布搭载深度思考的 Gemini 进阶版正式达到 IMO 2025 国际数学奥林匹克竞赛金牌标准。Gemini(与 OpenAI 新模型)是首批获得 IMO 正式评分和认证的 AI 参赛队伍,其评分标准与学生解决方案相同,可以说实现了 ...
本文来自微信公众号:量子位(ID:QbitAI),作者:梦晨、西风,原标题《陶哲轩回应 OpenAI 新模型 IMO 夺金!GPT-5 测试版也曝光了》 ...
IMO被公认为全球最顶尖的数学竞赛,每年只有不到8%的参赛者能够获得金牌。而现在,一个AI模型做到了。 新模型最终成绩:新模型在总共6道题中成功解决了5道,获得35分(满分42分),超过了今年的金牌线。
刚刚,谷歌 DeepMind 宣布,其新一代 Gemini 进阶版模型在 IMO 竞赛中正式达到金牌得主水平,成功解决了六道超高难度试题中的五道,拿下 35 分(满分 42 分),成为首个获得奥赛组委会官方认定为金牌的AI系统。 更重要的是,该系统首次证明人工智能无需依赖专业编程语言,仅通过自然语言理解即可攻克复杂数学难题。 谷歌 DeepMind 首席执行官哈萨比斯在社交媒体平台 X 上强调:这 ...
最近大家应该都被OpenAI和谷歌的内部模型获得IMO2025金牌的消息刷屏了,但是正式参赛的公开的模型03high,Gemini 2.5 pro等表现很差,连铜牌都没拿到,不过现在又有了一个新情况刚刚发布在arXiv上的研究论文《Gemini ...
OpenAI表示,同一个组织使用其技术将文章翻译成西班牙语,然后在拉丁美洲传播。 这些文章批评美国的社会和政治。 另外,该报告称,OpenAI的研究人员发现了一个据信以柬埔寨为基地的活动,该活动利用该公司的技术生成和翻译社交媒体评论,帮助推动一种名为“ 杀猪盘 ”的骗局。
此外,OpenAI 对 GPT-4.5 进行了广泛的安全测试,包括有害内容拒绝、幻觉评估、偏见检测、越狱攻击防护等:GPT-4.5 在拒绝不安全内容方面表现良好 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果