1Password 开源基准测试，以阻止 AI 代理泄露凭证 - Help Net Security

English 日本語 Español

Help Net Security 2026年02月12日

1Password 发布了开源的 SCAM 基准测试，以测试 AI 代理在真实工作流程中是否安全地处理凭证。

阅读全文

内容摘要

1Password 发布了一个名为安全理解与意识衡量（SCAM）的新型开源基准测试，旨在评估自主 AI 代理在执行涉及访问敏感信息的常规工作任务时是否表现安全。

SCAM 基准测试模拟了工作场所场景，嵌入了网络钓鱼链接和隐藏在文档中的敏感凭证等陷阱。在测试中，所有模型都出现了严重故障，例如将凭证输入到虚假登录页面，得分范围在 35% 到 92% 之间。

然而，当向模型提供一份简短的安全技能文件后，所有模型的表现都显著提高，其中一些模型实现了零严重故障。这表明基本的安全指导可以大大减轻风险，尽管在一个涉及转发包含嵌入凭证的笔记的场景中，即使在提供指导后，一些模型的风险仍然很高。

(来源：Help Net Security)

English 日本語 Español

阅读全文

软银正创建一家建造数据中心的机器人公司——并已瞄准1000亿美元的首次公开募股

据报道 Anthropic 计划在下一轮融资中超越 OpenAI 的估值

亚马逊的云业务正在飙升——其资本支出也在飙升

消息人士：Anthropic 可能以 9000 亿美元的估值进行 500 亿美元的新一轮融资

埃隆·马斯克在法庭上最大的敌人是埃隆·马斯克

站在证人席上，Elon Musk 无法逃避他自己的推文

Meta 仍在 AR/VR 上烧钱

Satya Nadella 表示他已准备好“利用”新的 OpenAI 协议

微软称拥有超过 2000 万付费 Copilot 用户，且使用频率很高

Google Cloud 收入突破 200 亿美元，但表示增长受到产能限制