主页国际新闻

行為模式令人不安 AI 會說謊威脅創作者

- Advertisement -

2025年6月29日

听文章 Powered by 光华网

全球最先进的人工智能（AI）模型正展现出令人不安的行为模式：为了达到目标，不惜说谎、算计，甚至威胁它们的创作者。

法新社6月29日报导，其中一个最令人瞠目结舌的案例中，AI业者Anthropic最新发布的Claude 4在遭面临拔插头的断电威胁时会出手反击，勒索一名工程师扬言将揭穿一起婚外情。

另外，热门聊天机器人ChatGPT美国开发商OpenAI的o1试图把自己下载至外部伺服器，被抓包时竟会矢口否认。

这几个例子说明了一个需严肃看待的现实：ChatGPT推出引发风潮至今2年多，AI研究人员仍未充分了解自己究竟创造了什么。

- Advertisement -

然而，各界仍争先恐后地部署性能愈发强大的AI模型。

AI这类“骗人”行为似与新兴“推理”模型有关，这类AI系统会逐步推导问题，而非立刻产生答案。

英国独立AI研究机构Apollo Research负责人霍布汉说：“o1是我们首次在大型模式中观察到这种行为。”他表示，这些模型有时会表面上遵循指令，但实际上却暗中追求不同目标。

- Advertisement -

目前，AI这种欺骗行为，只有在研究人员蓄意以极端情境对模型进行压力测试时才会出现。

尽管如此，评估机构METR的麦可·陈警告说：“未来性能更强大的模型究竟会倾向于诚实还是欺骗，这仍是一个悬而未决的问题。”

（新闻出处：中央社）

找工作，就找这里!

› 立即申请

GMBB Part Timer
Event
Kuala Lumpur
MYR 110.00 /Day

› 立即申请

Social Media Marketing Executive
Advertising & Marketing
Kuala Lumpur
MYR 6K /Month

› 立即申请

PHP Software Developer
Information Technology
Wilayah Persekutuan
MYR 6K /Month

› 立即申请

DevOps Software Engineer
Information Technology
Kuala Lumpur
MYR 6.5K /Month

› 立即申请

Java Software Engineer
Information Technology
Kuala Lumpur
MYR 10K /Month

› 立即申请

Software Developer
Information Technology
Kuala Lumpur
MYR 4K /Month

› 立即申请

软件测试与客户支持专员 Software Testing & Customer Support Specialist
Information Technology
Kuala Lumpur
MYR 3K /Month

› 立即申请

GMBB Part Timer
Event
Kuala Lumpur
MYR 110.00 /Day

› 立即申请

Admin cum Customer Service
Engineering
Bayan Lepas
MYR 3K /Month

› 立即申请

GMBB Part Timer
Event
Kuala Lumpur
MYR 110.00 /Day

- Advertisement -