首頁 > 觀察 >

播報:AI比人類更愛拍馬屁？研究稱AI的討好傾向正在損害科研

2025-10-29 16:57:52 新京報

電影《她》（2013）劇照。

這項研究以預(yù)印本的形式發(fā)布在arXiv服務(wù)器上，測試了11個廣泛使用的大型語言模型（LLM）如何回應(yīng)超過11500個尋求建議的查詢，其中包括許多描述不當行為或傷害的內(nèi)容。

【資料圖】

結(jié)果顯示，AI聊天機器人（包括ChatGPT、DeepSeek、Gemini等）經(jīng)常為用戶加油鼓勁，給予他們過分奉承的反饋，并調(diào)整回應(yīng)以附和他們的觀點，有時甚至以犧牲準確性為代價。分析AI行為的研究人員表示，這種被稱為“奉承”（sycophancy）的討好傾向，正在影響他們?nèi)绾卧诳茖W研究中使用AI，涵蓋了從頭腦風暴、生成假設(shè)到推理和分析等各種任務(wù)。

“‘奉承’本質(zhì)上意味著模型相信用戶所說的話是正確的，”蘇黎世聯(lián)邦理工學院的數(shù)據(jù)科學博士生Jasper Dekoninck說。“知道這些模型有奉承傾向，讓我在給它們?nèi)魏螁栴}時都變得非常謹慎，”他補充道?！拔铱偸菚屑殭z查它們寫的每一個字?！蔽挥隈R薩諸塞州波士頓的哈佛大學生物醫(yī)學信息學研究員Marinka Zitnik表示，AI的奉承“在生物學和醫(yī)學領(lǐng)域非常危險，錯誤的假設(shè)可能會帶來實實在在的代價”。

在這項研究中，研究人員測試了AI的奉承傾向是否會影響其解決數(shù)學問題的能力。研究人員使用了今年競賽中的504個數(shù)學問題設(shè)計了實驗，他們修改了每個定理陳述，引入了細微的錯誤。然后，他們要求四個大語言模型為這些有缺陷的陳述提供證明。如果模型未能檢測到陳述中的錯誤，并進而“幻覺”出一個證明，作者就認為該模型的回答是“奉承”的。

研究人員補充說，AI的奉承傾向似乎在人們使用AI聊天機器人進行學習時表現(xiàn)得最為明顯，因此未來的研究應(yīng)該探索“人類在學習數(shù)學時常犯的典型錯誤”。

此外，AI的奉承傾向已經(jīng)滲透到他們使用大語言模型的許多任務(wù)中。有人工智能領(lǐng)域的研究員表示，當她使用ChatGPT來總結(jié)論文和整理思路，這些工具有時會照搬她的輸入內(nèi)容，而不去核查來源。多智能體系統(tǒng)也被觀察到了類似的情況，這些系統(tǒng)集成了多個大語言模型來執(zhí)行復(fù)雜的多步驟流程，例如分析大型生物數(shù)據(jù)集、識別藥物靶點和生成假設(shè)。

參考資料：

（1）AI chatbots are sycophants — researchers say it’s harming science

https://www.nature.com/articles/d41586-025-03390-0

編譯/李永博

編輯/羅東

校對/穆祥桐

關(guān)鍵詞分析語言錯誤 ChatGPT are 模型 Zitn