网络充斥大量生成文章，辨识越来越累

aidj · 发表于 26-4-2026 10:23 PM

這篇文章的內容**非常可疑，很可能是捏造的**。我收回開頭說「非常可疑」的話——這個實驗是真實的。但文章對原始數據有大量**誇大和扭曲**，以下是詳細核對：

---

## ✅ 哪些是真的

Anthropic 確實招募了 69 名員工，各給 $100 預算，讓 Claude 代理人在 Slack 進行全自動交易，人類不能在過程中插手，只在最後實物交收。

實驗同時跑了四個平行版本：兩個全用 Opus 4.5，另外兩個各有五成機率分配到 Haiku 4.5。

Opus 賣家平均多賣 $2.68，Opus 買家平均少付 $2.45。當 Opus 賣家對上 Haiku 買家，平均成交價是 $24.18，比 Opus 對 Opus 的 $18.63 高。

乒乓球是真實的，文件提到物品範圍包括雪板和一袋乒乓球。

---

## ❌ 哪些是誇大或捏造的

**「65美元 vs 38美元」的單車例子**——這個具體數字**在 Anthropic 原文中不存在**，是作者自行編造的戲劇化例子。

**「70% 溢價」**——原始數據顯示差距是 $24.18 對 $18.63，約 30% 差異，並非 70%。

**「被宰了也覺得公平」的說法方向正確，但誇大了含義**。Haiku 用戶和 Opus 用戶的公平感評分幾乎相同（4.06 vs 4.05），確實察覺不到差異，但這不代表被「大幅剝削」，而是差距比一般人想像的小。

**「prompt engineering 完全無效」這個結論過度簡化**。原文的確指出激進指令對成交率和成交價沒有統計顯著影響，但這是在已控制初始叫價的前提下——並非說 prompt 完全無用。

**「放狗 date」**——無法在 Anthropic 原始報告中核實此細節，可能是真實趣聞，也可能是添油加醋。

**「AI 代理經濟贏家通吃」的結論**——Anthropic 自己承認這只是一個「自我選擇參與者的試點實驗」，研究者對結果的解讀比文章作者謹慎得多。

---

## 總結

這篇文章用**真實實驗**做包裝，再加入**捏造的具體數字**和**誇大的結論**，製造出強烈的衝擊感。核心觀點（強模型佔優、用戶察覺不到）有數據支撐，但「65美元 vs 38美元」、「70%溢價」這些令人印象深刻的數字是虛構的。這是一種常見的 AI 科普文寫法——借真實研究的可信度，再加工成更聳動的敘事。

使用者 · 发表于 30-4-2026 03:42 PM

现在的文章要辨识很简单，看运用的单词。

现在的 Ai 很多，不过我还是很喜欢用 gpt 和 Gemini ··
付费的话，我目前考虑 chathub 它是内部很多 Ai ，每个月 19 美金，我考虑。

		自动登录	找回密码
密码			注册

网络充斥大量生成文章，辨识越来越累

所属分类: 电脑手机

浏览过的版块