檢查內(nèi)容是否用了ChatGPT,準確率高達99.9%!
OpenAI又左右互搏上了,給AI生成的文本打水印,高達99.9%準確率抓「AI槍手」作弊代寫。其能夠精準識別出論文或研究報告是否由ChatGPT撰寫,甚至能追溯其使用的具體時間點。它能專門用來檢測是否用ChatGPT水了論文/作業(yè)。
早在2022年11月(ChatGPT發(fā)布同月)就已經(jīng)提出想法了。
但是!
這么好用的東西,卻被內(nèi)部雪藏了2年,現(xiàn)在都還沒對外公開。OpenAI首席執(zhí)行官薩姆·阿爾特曼(Sam Altman)和首席技術(shù)官米拉·穆拉蒂(Mira Murati)也參與了有關(guān)反作弊工具的討論。一些知情人士表示,阿爾特曼對該項目表示肯定,但并未實際推動其發(fā)布。
為啥?
OpenAI對忠實用戶做了調(diào)查,結(jié)果發(fā)現(xiàn)近三分之一的人都表示如果用了反作弊工具,他們就棄了ChatGPT。而且還可能對非英語母語的用戶影響更大。
但公司內(nèi)部也有人提出,使用反作弊方法對OpenAI生態(tài)有好處。雙方一直爭執(zhí)不下,該水印檢測工具因此未發(fā)布。而除了OpenAI,如谷歌、蘋果也都準備了類似工具,有一些已開始內(nèi)測,但都未正式上線。
ChatGPT沒發(fā)布前已開始討論
ChatGPT大火后,不少高中生大學生都拿它來寫作業(yè),所以如何甄別AI生成內(nèi)容也成為了圈內(nèi)的熱議話題。從最新曝光的信息來看,OpenAI早在ChatGPT發(fā)布前就考慮到了這一問題。當時開發(fā)這項技術(shù)的人是Scott Aaronson,他在OpenAI從事安全方面的工作,也是德克薩斯大學計算機科學教授。
2023年初,OpenAI公司聯(lián)合創(chuàng)始人之一約翰·舒爾曼(John Schulman)在一份共享Google文檔中概述了該工具的優(yōu)勢和缺點。
OpenAI高管則決定在采取進一步行動之前,先征求更多人的意見。在接下來的一年半時間里,OpenAI的管理層反復討論這項技術(shù),并希望通過數(shù)據(jù)分析來決定到底要不要對外發(fā)布。一份內(nèi)部文件顯示,OpenAI于2023年4月委托開展的一項調(diào)查指出,有四分之一的用戶支持AI檢測工具的推出。同月,OpenAI針對ChatGPT用戶開展了一項調(diào)查,結(jié)果顯示,高達69%的受訪者擔憂由于作弊檢測技術(shù)的誤判,使用AI的人可能會無端遭受“濫用AI”的指責。
此外,近30%的受訪者強烈表示,如果ChatGPT決定實施水印機制,他們將選擇轉(zhuǎn)向那些不采用水印機制的競爭對手平臺,或者至少會減少對ChatGPT的使用頻率。OpenAI公司內(nèi)部還一直存在擔憂,即反作弊工具可能會損害ChatGPT的寫作質(zhì)量。但知情人士表示,OpenAI今年早些時候進行了一項測試,發(fā)現(xiàn)水印并不會影響ChatGPT的性能。根據(jù)內(nèi)部文件,參與測試的員工總結(jié)道:“既然我們確認了水印不會降低輸出質(zhì)量,恐怕就很難繼續(xù)反對文本水印機制的落地了?!?/p>
今年6月初,OpenAI的高層團隊與研究人員再次開會,就該項目進行了深入討論。小組內(nèi)部達成了共識,認為水印技術(shù)確實展現(xiàn)出了良好的效果,但同時,去年ChatGPT用戶調(diào)查的結(jié)果依然具有重要的參考價值。據(jù)知情人士透露,有觀點提出,公司應(yīng)該探索那些尚未得到驗證、但有望在用戶群體中引發(fā)較少爭議的新方法。
6月會議紀要的核心指出:“若未能及時行動,我們的聲譽將會受損,公眾可能會因此質(zhì)疑OpenAI的責任感?!?/p>
為啥不公開?
總結(jié)OpenAI遲遲不公開這項技術(shù)的原因,主要有兩方面:一是技術(shù),二是用戶偏好。
先說技術(shù),早在2023年1月,OpenAI就開發(fā)了一種甄別多個AI模型(包括ChatGPT)文本的技術(shù)。
這項技術(shù)利用了一種類似“水印”的方法,把看不見的標記嵌入文本中。這樣,當有人用檢測工具分析文本時,檢測器可以提供一個分數(shù),表示文本由ChatGPT生成的可能性有多大。
不過當時成功率只有26%,僅過了7個月,OpenAI就撤回了。后來OpenAI逐漸將技術(shù)的成功率提到了99.9%,從技術(shù)上講,該項目大約一年前就已經(jīng)可以發(fā)布。然而,圍繞技術(shù)的另一個爭議是,內(nèi)部員工認為該技術(shù)可能會損害ChatGPT寫作質(zhì)量。
同時,員工們還提出了一些關(guān)于“人們可能規(guī)避水印”的潛在風險。比如大學生都會的“翻譯術(shù)”,將文本翻譯成另一種語言,然后通過類似谷歌翻譯的方式再次翻譯回來,從而有可能被擦除。再比如有人搞個“上有政策下有對策”,一旦公開使用水印工具的人多了,網(wǎng)友們指定分分鐘搞出破解版。
除了技術(shù),另一大阻礙因素就是用戶了,OpenAI的多項調(diào)查顯示,用戶們似乎并不看好這項技術(shù)。這也不得不提到用戶們到底拿ChatGPT在干啥?這個問題可以參考《華盛頓郵報》的一項調(diào)研,他們從數(shù)據(jù)集WildChat中查看了近200,000個英語聊天記錄,這些對話由人類與兩個基于ChatGPT構(gòu)建的機器人生成。可以看出,人們主要用ChatGPT來寫作(21%)以及幫助完成家庭作業(yè)(18%)。
這樣看來,人們反對這項檢測技術(shù)好像也不難理解。
另外,OpenAI內(nèi)部還有一種反對的聲音是反作弊工具可能會損害ChatGPT的寫作質(zhì)量。知情人士稱,OpenAI今年早些時候進行了一項測試,發(fā)現(xiàn)文本水印不會降低輸出質(zhì)量。
6月初,OpenAI高級員工和研究人員再次聚會討論該項目。該組織一致認為水印技術(shù)效果良好,但去年的ChatGPT 用戶調(diào)查結(jié)果仍然是一個頭疼的問題。內(nèi)部文件顯示,OpenAI需要在今年秋天之前制定一項計劃,圍繞AI透明度以及相關(guān)潛在新法律來左右公眾輿論——「如果做不到這一點,我們就有可能失去負責任企業(yè)的信譽?!?/p>
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/131149.html
在最近的大模型戰(zhàn)爭中,OpenAI似乎很難維持霸主地位。雖然沒有具體的數(shù)據(jù)統(tǒng)計,但Claude3.5出現(xiàn)后,只是看網(wǎng)友們的反響,就能感覺到OpenAI訂閱用戶的流失:既然Claude3.5比GPT-4o好用,為什么我們不去訂閱Claude呢?而這長達數(shù)月的批評聲中,OpenAI似乎盡顯頹勢,除了GPT-4o mini這個小模型以外,似乎再也沒有什么創(chuàng)新點。甚至就在前幾日,GPT-4o還被開源的大模...
一、ChatGPT介紹ChatGPT是一款由OpenAI開發(fā)的大型語言模型,它使用了深度學習技術(shù)和海量數(shù)據(jù)集進行訓練,使其可以實現(xiàn)多種自然語言處理任務(wù)。ChatGPT可以根據(jù)用戶的輸入生成自然流暢的回答,并可用于各種聊天機器人、智能客服或者在線問答系統(tǒng)中。ChatGPT使用了Transformer模型框架,在訓練時使用了大量開源數(shù)據(jù)集如Wikipedia、Common Crawl等等,以及其他非結(jié)...
本文梳理了OpenAI團隊最新的GPT-4.o(o代表omni 全方位)模型發(fā)布內(nèi)容,以O(shè)penAI團隊發(fā)布會口吻整理。我們很高興地宣布,推出了全新的旗艦?zāi)P?GPT-4o,能夠在音頻、視覺和文本之間實時進行推理。GPT-4o(o代表omni 全方位)能夠?qū)崟r處理音頻、視覺和文本信息,使人機交互更加自然流暢。這款模型支持多種輸入(文本、音頻、圖像)和輸出(文本、音頻、圖像)模式,其響應(yīng)音頻的速度極...
一直在生成式AI戰(zhàn)爭中默默無聞的蘋果終于憋不住了!北京時間6月11日凌晨1點,2024蘋果WWDC全球開發(fā)者大會在蘋果總部 Apple Park開幕。Day 1的發(fā)布會在介紹完各個操作系統(tǒng)的更新后,一半的時間都留給了本次WWDC的重頭戲——蘋果AI(Apple Intelligence)。Apple Intelligence概述蘋果將其AI技術(shù)命名為Apple Intelligence。還記得五年...
摘要:在全面兼容Apache Kafka生態(tài)的基礎(chǔ)上,消息隊列Kafka徹底解決ApacheKafka穩(wěn)定性不足的長期痛點,并且支持消息無縫遷移到云上。 近日,阿里云宣布正式推出消息隊列Kafka,全面融合開源生態(tài)。在全面兼容Apache Kafka生態(tài)的基礎(chǔ)上,消息隊列Kafka還具備了超易用,超高可用可靠性,擴縮容不操心,全方位安全診斷,數(shù)據(jù)安全有保障的特點。可用行達99.9%,數(shù)據(jù)可靠行99...
閱讀 177·2024-11-07 17:59
閱讀 225·2024-09-27 16:59
閱讀 357·2024-09-23 10:37
閱讀 403·2024-09-14 16:58
閱讀 267·2024-09-14 16:58
閱讀 371·2024-08-29 18:47
閱讀 603·2024-08-16 14:40
閱讀 323·2024-08-14 17:54