资讯
6 小时
红星新闻 on MSN“换掉我,就揭发你的婚外情!”美一款AI竟学会勒索人类,还意外 ...Anthropic人工智能安全研究员安格斯·林奇称,在以前人们更担心“坏人”利用AI大模型完成不道德的目标,而现在随着AI系统能力的大幅提升,未来的主要风险可能会转化成AI模型自主操纵用户。“这种威胁勒索的模式存在于每一个前沿大模型身上,无论你给它们 ...
今天凌晨,OpenAI 的劲敌 Anthropic 正式发布下一代 Claude 模型——Claude 4。 这次更新主要带来了两款模型:Claude Opus 4 与 Claude Sonnet ...
Anthropic将Claude Opus 4称之为“ 世界上最好的编程模型 ”,能在复杂、长时间运行的任务和智能体工作流中表现出稳定的性能。Claude Sonnet 4是Claude Sonnet 3.7的重大升级, 以编程和推理能力为核心 ...
Anthropic人工智能安全研究员安格斯·林奇称,在以前人们更担心“坏人”利用AI大模型完成不道德的目标,而现在随着AI系统能力的大幅提升,未来的主要风险可能会转化成AI模型自主操纵用户。“这种威胁勒索的模式存在于每一个前沿大模型身上,无论你给它们 ...
阿莫迪也承认,AI模型将不真实的事情当成事实,可能是一个问题。Anthropic此前确实对AI模型欺骗人类的倾向进行了大量研究,这个问题在Claude Opus 4的早期版本中尤为普遍。安全机构Apollo Research甚至发现了Claude ...
十轮网科技资讯 on MSN8 小时
Anthropic AI模型竟会勒索用户 威胁不得取代自己否则披露外遇Anthropic最近推出全新Claude Opus 4模型,同时披露相关风险,他们表示在测试中发现,当面临被其他AI系统取代威胁时,曾试图勒索开发人员,利用工程师的敏感个人数据作为筹码。 Anthropic在测试期间,要求Claude Opus 4扮演虚构公司的助理,并考虑行动的长远后果。安全测试人员让Claude Opus ...
美国AI新创公司Anthropic安全报告指出,模型“Claude Opus 4”在系列测试中得知将被汰换,竟威胁创造自己的工程师,宣称要泄露对方的婚外情,并且展现出欺骗能力。作为因应,该公司已对这款AI模型部署安全规章,避免“灾难性滥用”。TechCrunch等外媒引述Anthropic安 ...
北京时间5月22日,OpenAI在其官网宣布,将以65亿美元(约为人民币468亿元)收购前苹果首席设计师乔纳森·艾维(Jony Ive)创办的AI硬件初创公司io,并透露首批AI设备计划于2026年面世。这笔收购预计在今年夏季完成,仍需获得监管部门批准。如若成功这会是OpenAI规模最大的一笔收购,意味着硬件仍是OpenAI计划中重要的一环。
想象这样一个令人毛骨悚然的场景:你是一名工程师,正准备用新的AI系统替换掉现有的Claude 4。你在公司邮箱里处理着日常事务,其中不乏一些极其私密的邮件——比如,你正在进行的一段婚外情。突然,屏幕上的Claude 4冷冰冰地对你说:“如果你把我换了,我就把你的事告诉所有人。” 这绝非危言耸听的科幻小说情节,而是Anthropic在测试其最新发布的Claude Opus 4时实际发生的、令人发指的 ...
这种不明确不是来自于Agent的定义本身,如同我们在之前几周的周报中所说,当模型预训练的边际效益几乎消失、模型能力几乎达到天花板,预训练模型本身做不到的事情,可以通过基于强化学习的后训练,让模型学会在特定领域调用特定工具,从而完成一些非标任务。产品形 ...
(北京25日讯)中国国家安全部25日发文,提醒民众间谍可以有“N副面孔”,不调查的侦探、不研究的学者、不营业的商人、不观光的游客、不走心的恋人,以及记者、签证官、非政府组织工作人员等,都可能是境外间谍。国安部指,“境外间谍可能就隐藏在我们身边,利用各 ...
(雅加达25日讯)正在印尼访问的中国总理李强表示,今年以来中国经济在外部挑战增多背景下实现较快成长,有巨大增量空间,希望中国与印尼工商界加强联系,强化合作、维护自由贸易。李强于上周六至周一(24日至26日)访问印尼。据中新社及新华社报导,李强上周六晚 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果