久久久亚洲欧洲日产国码农村,久久9精品区-无套内射无码,久久精品国产国产精,久久久久久久久久久,久久久精品免费

首頁 > 觀察 >

播報:AI比人類更愛拍馬屁?研究稱AI的討好傾向正在損害科研

2025-10-29 16:57:52 新京報

電影《她》(2013)劇照。

這項研究以預(yù)印本的形式發(fā)布在arXiv服務(wù)器上,測試了11個廣泛使用的大型語言模型(LLM)如何回應(yīng)超過11500個尋求建議的查詢,其中包括許多描述不當行為或傷害的內(nèi)容。


【資料圖】

結(jié)果顯示,AI聊天機器人(包括ChatGPT、DeepSeek、Gemini等)經(jīng)常為用戶加油鼓勁,給予他們過分奉承的反饋,并調(diào)整回應(yīng)以附和他們的觀點,有時甚至以犧牲準確性為代價。分析AI行為的研究人員表示,這種被稱為“奉承”(sycophancy)的討好傾向,正在影響他們?nèi)绾卧诳茖W研究中使用AI,涵蓋了從頭腦風暴、生成假設(shè)到推理和分析等各種任務(wù)。

“‘奉承’本質(zhì)上意味著模型相信用戶所說的話是正確的,”蘇黎世聯(lián)邦理工學院的數(shù)據(jù)科學博士生Jasper Dekoninck說。“知道這些模型有奉承傾向,讓我在給它們?nèi)魏螁栴}時都變得非常謹慎,”他補充道?!拔铱偸菚屑殭z查它們寫的每一個字?!蔽挥隈R薩諸塞州波士頓的哈佛大學生物醫(yī)學信息學研究員Marinka Zitnik表示,AI的奉承“在生物學和醫(yī)學領(lǐng)域非常危險,錯誤的假設(shè)可能會帶來實實在在的代價”。

在這項研究中,研究人員測試了AI的奉承傾向是否會影響其解決數(shù)學問題的能力。研究人員使用了今年競賽中的504個數(shù)學問題設(shè)計了實驗,他們修改了每個定理陳述,引入了細微的錯誤。然后,他們要求四個大語言模型為這些有缺陷的陳述提供證明。如果模型未能檢測到陳述中的錯誤,并進而“幻覺”出一個證明,作者就認為該模型的回答是“奉承”的。

研究人員補充說,AI的奉承傾向似乎在人們使用AI聊天機器人進行學習時表現(xiàn)得最為明顯,因此未來的研究應(yīng)該探索“人類在學習數(shù)學時常犯的典型錯誤”。

此外,AI的奉承傾向已經(jīng)滲透到他們使用大語言模型的許多任務(wù)中。有人工智能領(lǐng)域的研究員表示,當她使用ChatGPT來總結(jié)論文和整理思路,這些工具有時會照搬她的輸入內(nèi)容,而不去核查來源。多智能體系統(tǒng)也被觀察到了類似的情況,這些系統(tǒng)集成了多個大語言模型來執(zhí)行復(fù)雜的多步驟流程,例如分析大型生物數(shù)據(jù)集、識別藥物靶點和生成假設(shè)。

參考資料:

(1)AI chatbots are sycophants — researchers say it’s harming science

https://www.nature.com/articles/d41586-025-03390-0

編譯/李永博

編輯/羅東

校對/穆祥桐

關(guān)鍵詞 分析 語言 錯誤 ChatGPT are 模型 Zitn

相關(guān)推薦