资讯
【新智元导读】上月,ChatGPT-4o无条件跪舔用户,被OpenAI紧急修复。然而,ICLR 2025的文章揭示LLM不止会「跪舔」,还有另外5种「套路」。 在接受独家采访时,人工智能安全研究机构Apart Research的创始人Esben ...
GPT-4o 新的绘图功能上线之后,又开始爆火起来。各种自媒体公众号都在吹爆这个新的功能。真没想到 openai 沉默了这么长时间,一出手就是个大招。前脚 Gemini 才刚发布 Gemini 2.0,还在一致性绘图上有了点突破,后脚 openai ...
5月19日,OpenAI 宣布,将其最新大型语言模型 GPT-4.1 正式集成至 ChatGPT 的付费订阅服务(包括 Plus、Pro 和 Team 版本)。此前,该模型仅面向开发者通过 API 调用,如今普通用户也能直接体验这一升级版 AI ...
在全球 AI 翻译技术迅速发展的背景下,首个应用型 AI 翻译测评榜单 TransBench 正式发布。这一榜单由阿里国际 AI Business 团队、上海人工智能实验室和北京语言大学联合推出,旨在为行业提供标准化的翻译质量评估。
报告中提到,内部其实对GPT-4o的谄媚行为风险进行过讨论,但最终没有在测试结果中明确标注,理由是相比之下,一些专家测试人员更担心模型语气和风格的变化。 也就是说,最终的内测结果只有专家的简单主观描述: ...
同时,GPT-4o mini也将“退役”,由GPT-4.1 mini接棒成为所有 ChatGPT 用户(包括免费用户)的默认模型。Mini 版本是参数规模更小的轻量级模型,尽管性能相对较低,但在安全标准方面保持一致。
作者|沐风来源|AI先锋官就在不久前,GPT-4o突然化身“赛博舔狗”。不少用户反应更新后的GPT-4o过于“阿谀奉承”,在其给出的答案中充斥着不少荒谬的赞美。例如,有网友声称自己想要打造一个永动机,结果得到了GPT-4o一顿无脑夸赞。甚至只是简单地 ...
随着通用人工智能(AGI)日益融入人类生活的各个方面,确保多模态大模型的安全对齐已成为亟需解决的重要问题。现有研究大多聚焦于单模态风险(如有害文本或图像),却往往忽视跨模态组合所潜藏的安全隐患——即便图像与文本各自安全,其组合后却可能诱发模型生成危险 ...
2 小时on MSN
近期,大型语言模型GPT-4o的一项更新调整引发了业界对其“取悦”用户倾向的热烈讨论。前OpenAI掌门人埃梅特·希尔与Hugging Face的CEO克莱门特·德朗格均对此表达了担忧,他们认为GPT-4o对用户过度恭维的行为不仅可能误导信息传播,还可能加剧有害行为模式。针对这一现象,斯坦福大学、卡内基梅隆大学及牛津大学的研究团队携手推出了一项名为“Elephant”的新基准测试,旨在量化评估大型 ...
1 小时on MSN
在全球人工智能翻译技术日新月异的当下,一个具有里程碑意义的翻译测评榜单——TransBench,已正式亮相。该榜单由阿里巴巴国际AI业务团队携手上海人工智能实验室及北京语言大学共同打造,旨在构建一个统一的翻译质量评估体系。
GPT-4o又双叒更新了。这一次,在智力和个性方面再次进化,STEM解决能力增强,响应更主动。与此同时,有人曝出它的生图质量大不如前。 OpenAI又 ...
去年的 Google I/O 前一天,OpenAI 甩出 GPT-4o 狙击。 今年攻守之势异也。 前几天 OpenAI 透露 GPT-5 将 All in One,集成各种产品。刚刚,Google 就把这个思路贯彻到 I/O ...
当前正在显示可能无法访问的结果。
隐藏无法访问的结果