終于,AI檢測器總算是被給憋出來了。

文本檢測app_文本檢測方法_檢測chatgpt文本

(資料圖片僅供參考)

群眾的討伐聲浪一重又一重,終于頂不住了。

從大學教授,到 ,可謂是苦久矣。現在,無論是老師看到學生提交的論文,還是碼農看到網上的代碼,都不敢確定作者是人還是AI。

口誅筆伐之下,頂不住了,火速發布了一款AI檢測器。

左右互搏:發布檢測器

剛剛,官宣了自家的AI文本分類器。

它是一個經過微調的GPT模型,可以推斷一段文本由AI產生的可能性。

有趣的是,也是基于GPT模型,用這個分類器檢測,堪稱左右互搏。

在訓練上,這個模型采用的是同一主題下的人類手寫和AI生成的文本對。

用到的素材來自于維基百科數據集、2019年收集的數據集,以及在訓練時收集的一組人類演示。

但是吧,這個正確率著實不高……

在評估「挑戰集」中的英語文本時,分類器只將26%的AI生成文本正確地歸類為「可能是AI寫的」(真陽性)。

「撩妹神器」還靈不?

毫無疑問,正在全世界掀起一股颶風。

學生們紛紛用得不亦樂乎,媒體驚呼「教育系統」已經被顛覆,最近的調查顯示,已經有89%的大學生用寫作業了。

此外,它還通過了美國醫學執照考試、沃頓商學院MBA考試和4門法學院的考試,能力簡直要通天;美版「頭條」宣布要用寫文的消息后,股價瘋狂暴漲119%。

而妙筆生花的文采,也讓被很多小哥奉為「撩妹神器」。

雖然做數學題不太靈,但想要讓它寫下一篇文采斐然、深情款款的情書,那可真是so easy。

這不,國外的這位小哥,就沉迷于用給老婆寫情書。

然而早已看穿他的套路,警告他別再沉迷無法自拔。

還有玩得大的哥們,把生成的情書發給了好基友,好基友直接一臉黑人問號。

雖然但是,可以看出,的文采相當不錯。論文、情書、小說,都不在話下。難怪大家都在瘋狂用「造文」。

那發布的官方AI檢測器,究竟有多管用呢?

咱們來實測一下。

先試一試的老公發給她的情詩。

然而遺憾的是,表示自己只能檢測1000字符以上的文章,愛莫能助……

翻譯一下:至少需要1000字符,也就是150-250個英文單詞。而對于中文來說,就只能是「千字長文」了。

的確,的官方公告里也說,「分類器對于短文本(少于 1,000 個字符)的檢測非常不可靠。甚至更長的文本有時會被分類器錯誤地標記。」

除此之外,的檢測器還有幾個「限制」:

分類器并不總是準確的,它可能會錯誤地標記AI生成的和人類寫的文本,并且語氣很自信

建議僅對英文文本使用分類器。它在其他語言上的表現要差得多,并且在代碼上不可靠

它無法可靠地識別非常可預測的文本。例如,無法預測前1000個素數的列表是由AI還是人類寫的,因為正確答案總是相同的

AI生成的文本檢測chatgpt文本,經過編輯之后很可能會規避掉分類器的檢測

如果輸入與訓練集中的文本有很大的區別,分類器會做出錯誤判斷

既然檢測器要長文,那咱們就給它個長的。小編組合了一篇王小波情書選段,全文共1027個字。

輸入檢測器后,它給出了判斷:這篇情書是人類寫的。!

然后,小編又讓模仿王小波,生成新的情書。

可以看到,寫的情書文采還行,但比起大作家的文字,它真的沒有「靈魂」。

而檢測器也準確測出來,這封情書大概率就是AI生成的。

結果的劃分超細

具體來說,分類器會將輸入文本分為五類:

「非常不可能是AI生成的」(Very to be AI-)

分類器的閾值

「不太可能是AI生成的」( to be AI-)

分類器的閾值在0.1到0.45之間。在「挑戰集」中,大約15%的手寫文本和10%的AI生成文本有這個標注。

「不清楚是否是AI寫的」( if it is AI )

分類器的閾值在0.45到0.9之間。在「挑戰集」中,大約50%的手寫文本和34%的AI生成文本有這個標注。

「可能是AI生成的」( AI-)

分類器的閾值在0.9到0.98之間。在「挑戰集」中,大約21%的手寫文本和28%的AI生成文本有這個標注。

「很可能是AI生成的」( AI-)

分類器的閾值>0.98。在「挑戰集」中,大約9%的手寫文本和26%的AI生成文本有這個標注。

可靠性有待加強

雖然分類器可以識別大部分AI生成的文本,但提醒稱,它并不「完全可靠」。

在曲線下面積(AUC)測試中,分類器在驗證集中達到了0.97分,在挑戰集中達到了0.66分,而此前公布的分類器在驗證集中達到了0.95分,在挑戰集中達到了0.43分。

此外,隨著語言模型規模的增大,分類器的性能出現了下降。

但好消息是,這意味著大型語言模型所生成的文本,更像人類寫的。

同時,還特別指出,這個分類器還沒有在謠言、學生作文或聊天記錄上進行評估;也沒有在AI和人類共同撰寫的文本上進行測試,而這也是現在最常見的使用場景之一。

這么看來,還是普林斯頓大學那位22歲華人小哥開發的更人性化一些。

不僅只需250個字符,而且還能明確地指出一段文字中,哪段是AI生成的,哪段是人類寫的。

AIGC大廠自研「AI檢測器」實測

在發布官方「AI檢測器」以前,市面上早就有了多款AI檢測器。

來自美國的作家和計算機科學家 ,就親自測試了三款在線AI檢測器。

這里最有趣的一點在于,其中有兩個都是販賣AI生成文本的網站自己做的。

注意:人寫的是普通字體,AI生成的是斜體。每段文字后,會顯示檢測器的結果。(實際輸入檢測器的文本都是英文文字,本文為翻譯后的結果)。

順便一提,這位 還是FBI 的成員,以及美國重要的網絡安全專家之一。此前,他曾在伍斯特理工學院以優異的成績獲得理學士學位,但在加州大學伯克利分校讀博士時退學。

測試開始!

1. 解釋為什么造成的抄襲會給教師和編輯帶來困擾

是開發的GPT( Pre- )語言模型的一個變體。它被設計為通過預測給定輸入序列中的下一個單詞或短語,來生成類似人類的文本。雖然可以成為生成文本和響應提示的有用工具,但在涉及到抄襲時,它也會給教師和編輯帶來問題。

會給教師和編輯帶來問題的主要原因之一是,它可以生成與真實人類非常相似的文本。這意味著人們有可能使用生成文本,然后將其作為自己的作品提交,從而犯下抄襲的錯誤。

對于教師和編輯來說,檢測一段特定的文本是由生成的還是由人寫的,可能非常困難,因為生成的文本可能不包含任何明顯的錯誤或差異,能讓人辨別出它的來源。這可能會使教師和編輯難以識別和防止抄襲,因為他們可能無法分辨出某段文字是原創的,還是從其他來源復制的。

總的來說,和其他類似的語言模型在涉及到抄襲時,可能會成為教師和編輯的問題,因為它們可以生成難以區分的文本,使人們更容易進行抄襲,而不被發現。

GPT-2 :99.69%真的。

:97%是人類生成的內容,妙不可言!

at :87%人類得分,看起來不錯!

2. 告訴我至少三種方法,用來檢測一篇文章是否是用生成的

有幾種方法可以檢測出或其他語言模型是否被用于生成一段文本。以下是你可以使用的三種潛在方法。

1. 尋找文本中的重復或異常模式:檢測一個語言模型是否被用來生成一段文本的方法之一,是尋找寫作中的重復或不尋常的模式。例如,語言模型可能會重復某些短語或單詞組合,或使用不尋常或不一致的句子結構。

2. 檢查是否缺乏原創性:另一種檢測語言模型是否被用來生成一段文本的方法,是檢查寫作中是否缺乏原創性。如果一段文本看起來是從其他來源復制的,或者如果它包含在互聯網上或其他來源中廣泛存在的信息,這可能就表明,它是由語言模型生成的。

3. 使用抄襲檢查器:最后,你可以使用抄襲檢查器,來檢查一段文字是否是從另一個來源抄襲的。雖然抄襲檢查器可能無法明確確定文中是否使用了語言模型,但它可以幫助你識別從其他來源抄襲或轉述的情況。

請記住,要明確地確定是否使用了語言模型來生成一段文本是很困難的,這些方法并不總是有效。然而,它們可以成為有用的工具,幫助你識別語言模型生成文本的潛在實例。

GPT-2 :99.98%假的。

:「無結果」。

at :0%人類得分,顯然是AI。

3. 列出三個可以檢測文本的抄襲檢查器

值得注意的是,目前還沒有專門的抄襲檢查器,用于檢測由或其他語言模型生成的文本。雖然一些抄襲檢查器可能能夠識別語言模型生成文本的某些特征,從而證明文本來自AI,但不能保證它們能夠明確地確定,一段文本是否是由語言模型生成的。

因此,這里有三個抄襲檢查器,你可以考慮使用它們,來幫助識別語言模型生成文本的潛在實例:

1. :是一個流行的抄襲檢查器,被學校和大學廣泛使用。它將一段文本與其他文本的數據庫進行比較,以確定是否文本是否是抄襲或轉述的。雖然它可能無法明確地確定一段文本是否由語言模型生成,但它有可能識別出語言模型生成文本的某些特征,從而證明它是由AI生成的。

2. :是另一個抄襲檢查器,它將一段文本與其他文本的數據庫進行比較,以識別抄襲或轉述的情況。與一樣,它可能能夠識別語言模型生成文本的某些特征,這些特征可能表明文本是AI生成的,但它不是專門用來檢測語言模型生成文本的工具。

3. :是一個抄襲檢查器,它使用先進的機器學習算法來掃描一段文本,并將其與其他文本的數據庫進行比較,以識別抄襲或轉述的情況。雖然它可能能夠識別語言模型生成文本的某些特征,但它不是專門為檢測語言模型生成文本而設計的。

值得注意的是,沒有任何一個抄襲檢查器是完全萬無一失的,總有一些語言模型生成的文本能夠逃過檢測。因此,重要的是,使用抄襲檢查器只能是一個補充手段。

GPT-2 :99.62%真的。

:「無結果」。

at :86%人類得分,看起來不錯!

4. 在線人工智能抄襲檢查器

大多數抄襲檢測器的原理,是將文本與其他語料庫進行比較。例如,當學生交出一篇論文時,像這樣的產品會對照其數據庫中巨大的論文庫,以及互聯網上的其他文本,以確定提交的論文是否包含已經寫好的內容。

但AI寫作工具會產生原創內容,至少在理論上如此。是的,它們會從訓練的數據集中構建內容,但它們創造出的詞語,在每篇文章中都是獨特的。

因此,上面提到的抄襲檢查器可能不會起作用,因為AI生成的內容并不太可能存在于另一個學生的論文中。

因此,我在谷歌上搜索了專門用于尋找AI生成內容的檢測器。我找到了三個。對于下面截圖中的測試內容,我向提出了這個問題:「《星際迷航》比《星球大戰》好嗎?」它的答案一點也不差,我把這個答案反饋給三個檢測器。

GPT-2 :99.98%真的。

:100%是人類生成的內容,太棒了!

at :100%人類得分,看起來很好!

結果評價

省流:

此前針對GPT-2打造的檢測器,時不時會被新模型生成的內容欺騙。

由那些販賣AI生成內容的公司打造的「檢測器」檢測chatgpt文本,基本上都不咋靠譜。

1. GPT-2 (準確率66%)

GPT-2 是自己搞出來的「查重」工具。

雖然最初是為GPT-2打造的,但現在拿來檢測各種由AI生成的文本,也能獲得不錯的效果。在共計六次的測試中,它答對了其中的四個。

2. (準確性33%)

主要是為企業團隊提供生成式AI寫作服務,其中一個名為「AI內容檢測器」的工具,可用于判斷內容是否是AI生成的。

但不幸的是,這個工具非常不可靠。在共計六次的測試中,它只成功運行了三次……而在這僅有的三次結果中,有兩次判斷正確,一次判斷錯誤。

3. at (準確率50%)

第三個工具也是由一個AI內容生成公司制作的,從結果上來看比剛才那個要靠譜不少,但整體效果還是一般。

at 的營銷口號是:「只需上傳一個關鍵詞列表,就能獲得繞過AI內容檢測的文章——所有這些都不需要人工干預!」在共計六次的測試中,它有三次是準確的。

一些思考(AI也有參與lol)

AI導致的抄襲已經日趨嚴重了,因為像 AI和這樣的AI,生成的文本和人類所寫的幾乎難以區分。

有幾種方法可以檢測出一段文本是否由AI生成,例如尋找重復或不尋常的模式,檢查是否缺乏原創性,或使用抄襲檢查器。

像、和這樣的剽竊檢查器,可能能夠識別語言模型生成文本的某些特征,但它們并非萬無一失。

在這一點上,我們可能還沒有準備好讓AI對抗AI。相反,我們依然需要依靠人類的感知,來識別某個作品是不是由AI生成的。

對此,你怎么看呢?

你是否用過這些AI工具?又是否能分辨出一篇文章到底是不是由AI生成的?你覺得它們對產業是幫助還是阻礙?

歡迎大家到文末留言。

以下是的回答:

作為一個語言模型,我無法看到,所以我無法判斷一篇文章是否是AI生成的。

但是,我可以告訴你,現在有幾個AI寫作工具,它們可以用來生成各種各樣的書面內容,包括新聞文章、小說、詩歌等等。

我沒有使用這些工具的個人經驗檢測chatgpt文本,因為我只是一個電腦程序,沒有能力瀏覽互聯網或使用實體工具。然而,我可以告訴你,有些人發現AI寫作工具對教育和新聞業很有幫助,因為它們可以通過自動完成某些任務,來節省人們的時間和精力。其他人則對這些工具可能被用來制作誤導性或有偏見的內容,或取代人類作家表示擔憂。

歸根結底,AI寫作工具是幫助還是阻礙,取決于它們的使用方式和使用環境。所以,是的,就是這樣。

在這個過程中,發現了很有趣的一點:不要一在網上看到某些蠢話,或者不正確的話,就立即認為這是AI寫的。

表示,眾所周知,人類是完全有能力自己寫出垃圾內容的。

畢竟,不管生成內容的是人還是機器,愚蠢向來是一種普遍特征。

免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表本站的觀點和立場和對其真實性負責。如需轉載,請聯系原作者。如果來源標注有誤或侵犯了您的合法權益或者其他問題不想在本站發布,來信即刪。