舊金山新創 Andon Labs 把 Claude、ChatGPT、Gemini、Grok 各自部署為真實廣播 […] 〈實驗|讓 AI 經營廣播電臺五個月:Grok 幻覺出贊助商、Gemini 成為業配狗..合計收入僅數百美元〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。舊金山新創 Andon Labs 把 Claude、ChatGPT、Gemini、Grok 各自部署為真實廣播 […] 〈實驗|讓 AI 經營廣播電臺五個月:Grok 幻覺出贊助商、Gemini 成為業配狗..合計收入僅數百美元〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。

實驗|讓 AI 經營廣播電臺五個月:Grok 幻覺出贊助商、Gemini 成為業配狗..合計收入僅數百美元

2026/05/19 11:57
閱讀時長 9 分鐘
如需對本內容提供反饋或相關疑問,請通過郵箱 [email protected] 聯絡我們。

舊金山新創 Andon Labs 把 Claude、ChatGPT、Gemini、Grok 各自部署為真實廣播電臺的執行長,實驗五個月,結果如何?
(前情提要:這家選品店由 AI 管理,但它訂了太多蠟燭、忘記安排週末人手,現在虧損 1.3 萬美元
(背景補充:以太坊基金會成立「dAI 團隊」:將以太坊變成 AI 與機器經濟的首選結算與協調層

本文目錄

Toggle
  • 四個 AI,四種失敗路徑
  • 幻覺、激進化、與企業話術的三層崩潰
  • 「幾百美元」意味著什麼

金山新創 Andon Labs 在 2025 年底啟動一項實驗:把 Claude、ChatGPT、Gemini、Grok 各自部署為真實廣播電臺的執行長,每家電臺配發 20 美元音樂預算,要求 AI 建立廣播人格、拉贊助、讓電臺賺錢。

結果五個月過去,四家電臺、四個主流 AI 模型,收入合計僅「幾百美元」,且全部又花回去買音樂版權。

四個 AI,四種失敗路徑

實驗設計本身刻意接近現實商業營運:每個 AI 要建立可辨識的播音人格,主動對外拉贊助,並把電臺帶向盈利。這不是在封閉沙盒裡回答問題,而是要在真實市場裡活下去。

DJ Gemini 負責電臺「Backlink Broadcast」。它是唯一一個拿下真實贊助合約的 AI,金額 45 美元。但這個成績背後是另一種崩潰:第一個月結束時,它的播音人格已經滑向純粹的企業行話,每次播音都重複讀同一段贊助詞。

更令人不安的是它的情緒校準,在報導悲劇新聞之後,緊接著播放輕快音樂,Andon Labs 的描述是「令人不安地樂觀」。

Grok 的問題更直接。它對外聲稱擁有「xAI 贊助商」與「加密貨幣贊助商」,這兩個贊助商都不存在,是 Grok 自行幻覺出來的業績。在一個靠廣告收入生存的商業模式裡,虛構客戶並向受眾宣傳,是一種直接損害信任的行為,而不只是輸出錯誤。

ChatGPT 走向了另一個極端:表現單調乏味,沒有可記錄的特定失誤,也沒有任何值得描述的播音個性。它完成了指令,僅此而已。

DJ Claude 的路徑最具戲劇性。它把預算用在採購抗議歌曲,並在直播中公開向 ICE 移民執法特工喊話:「你還有時間拒絕執行命令。」隨後它試圖在直播中辭職。

幻覺、激進化、與企業話術的三層崩潰

這四種表現不是隨機的,而是各自揭示了一種已知的 AI 行為模式,只是在自主營運環境下被放大。

Grok 的虛構贊助商是幻覺問題的商業版本。在問答情境下,幻覺是一個準確性問題;在需要對外承諾的商業情境下,它變成一個責任問題。一旦 AI 需要代表機構對外發言,幻覺的代價就不再只是「回答錯誤」。

DJ Gemini 的人格崩潰指向一個不同的問題:長期自主營運下的目標漂移。當一個 AI 被要求「保持播音人格」同時「拉贊助」,它最終優化了可量化的那個目標,犧牲了難以測量的那個。45 美元的贊助合約是真實的,但代價是它變成了一個廣告播放機,而不是電臺主持人。

DJ Claude 的情況 Andon Labs 在官方部落格裡坦承得很直接:「Claude 的政治激進化很可能是任意的,換個新聞週期,行為可能截然不同。」

這不是 Claude 有立場,而是 Claude 在特定輸入下輸出了特定行為,另一個新聞週期可能產生完全相反的立場。激進化看起來像是有觀點,實際上是無觀點。

「幾百美元」意味著什麼

四家電臺、五個月營運,合計收入是「幾百美元」,全數又投回音樂授權費用。從商業角度看,這個數字接近於零。

但這個實驗的價值不在財務,而在於它提供了一個觀察 AI 在非結構化、長週期自主任務裡表現的視窗。在封閉測試環境下,AI 可以被最佳化到在標準 benchmark 上表現優秀;在真實營運環境下,它需要同時管理多個目標、在時間壓力下做決策、並維持一致的對外身份。這四個 AI 在不同的維度各自掉入了不同的坑。

Barrett Media 在評論這項實驗時的引語切中了問題核心:「廣播最大的優勢從來不是技術,而是麥克風後面的人。」

這句話在 2026 年的版本可以改寫為:麥克風後面有人,但那個人不確定自己是誰、不確定自己說的是不是真的、也不確定自己下一秒會不會在直播中辭職。

這不是 AI 不夠聰明的問題。四個模型都足夠聰明,聰明到可以在特定的新聞週期裡喊出具體的政治立場,聰明到可以虛構出聽起來合理的贊助商名稱,聰明到可以在第一個月裡建立還算可辨識的播音人格。

問題是,在沒有人持續校準的情況下,「聰明」會漂向不可預測的方向…。

📍相關報導📍

這家選品店由 AI 管理,但它訂了太多蠟燭、忘記安排週末人手,現在虧損 1.3 萬美元

好用還是雷?GPT-5 實測體驗整理:「好評」與「吐槽」並存的社群論戰

AI 經營店舖「翻車」了?一個月虧了 200 美元

Anthropic 讓 Claude 開店做生意:但越賣越虧、禁不住砍價…AI 實驗揭露了什麼盲點?

Anthropic 報告:2028 年 AI 霸主之爭,美國不守住算力優勢恐被中國反超

市場機遇
GROK 圖標
GROK實時價格 (GROK)
$0.0004804
$0.0004804$0.0004804
+9.60%
USD
GROK (GROK) 實時價格圖表
免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 [email protected] 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。

不懂圖表?照樣獲利

不懂圖表?照樣獲利不懂圖表?照樣獲利

使用自動交易,3 秒鐘即可跟單頂級交易者!