自爆火全球,贊譽隨之涌來,爭議也甚囂塵上。人們擔心的事還是發(fā)生了:用戶隱私遭到泄露,也讓陷入風波。

網(wǎng)友聲稱,其聊天欄出現(xiàn)了他人的聊天記錄標題。3月25日,發(fā)文證實,部分 Plus服務(wù)訂閱用戶可能泄露了部分個人隱私和支付信息。

“我們在本次關(guān)閉幾個小時前,部分用戶可能會看到另一位用戶的姓名、電子郵件地址、支付地址、信用卡信息。我們承諾在任何情況下,都不會暴露完整的信用卡號碼。”向用戶和整個社區(qū)致歉。

泄密風險點排查_泄密風險隱患_chatgpt使用泄密風險

圖源:社交平臺截圖

一紙道歉信,沒有平息風波。人們反而陷入擔憂,一向“神通廣大”的,會輕松竊走我的隱私嗎?令人炫目的AI技術(shù),會被不法分子利用嗎?

自稱“會保護隱私”

實際真的如此嗎?

到底會不會記住用戶的信息?我們先做了一個測試。當問它隱私話題時,的回答相當謹慎,不過,它有自相矛盾的地方。

首先,它聲稱不會記住用戶的任何信息,包括聊天內(nèi)容,但隨即又說,與用戶對話的數(shù)據(jù)可能存儲在的數(shù)據(jù)中心或使用的云服務(wù)提供商的數(shù)據(jù)中心。

提問:你和我之間的對話,你會保密嗎?

:作為一個AI訓(xùn)練模型,我沒有意識,也不能記憶您的任何信息,也不能主動泄露您的任何信息。我只能回答您的問題,并遵循的隱私政策。您可以放心與我對話。

提問:你和我聊天的數(shù)據(jù),你存儲在哪里?

:存儲訓(xùn)練和運行模型所需的數(shù)據(jù),并嚴格遵守隱私和安全政策。具體來說,您與我對話的數(shù)據(jù)可能存儲在的數(shù)據(jù)中心或使用的云服務(wù)提供商的數(shù)據(jù)中心中,以便實現(xiàn)最佳的性能和可用性。任何存儲的數(shù)據(jù)都受到嚴格的訪問控制和保護措施的保護,以確保您的數(shù)據(jù)安全。

宣稱“不會記住用戶信息”,從這次隱私事件來看,顯然是不成立了。那么,在和人們的對話中,會不會一不小心說漏嘴,泄露他人信息嗎?

浙江大學計算機學院教授湯斯亮告訴潮新聞記者,從大型語言模型的訓(xùn)練方式來看,的確存在隱私漏洞。比如,讓它補寫代碼,它會東邊摘一點,西邊摘一點,合成一段代碼。但有人發(fā)現(xiàn),它補出來的代碼跟網(wǎng)上代碼是一樣的。它其實是在抄那些代碼。

如果再延伸一下,比如讓它補李彥宏的身份證,的確能補出一串數(shù)字,也是18位格式,但并不是真實的李彥宏身份證,只是它知道身份證有18位。有人擔心,如果它能獲取真實的身份證,那隱私可能會被泄露。

但是,湯斯亮也指出,雖然收集了個人數(shù)據(jù),但這些數(shù)據(jù)未必會用來訓(xùn)練,因為它學習語料的代價很高,每訓(xùn)練一次就需要大量資金投入。雖然你把身份證告訴它,它可能只是存儲了,也可能不存儲。

“就算真的記住了身份證號,如果不加以刻意地引導(dǎo)、提示,它并不會用來生成回答。這段信息存在它龐大的45TB語料之中,日后生成出來的概率是極其微小的。”湯斯亮說。

泄密風險隱患_chatgpt使用泄密風險_泄密風險點排查

圖源:新華社

泄密、攻擊、虛假信息

語言模型里的隱私誰來保護?

已推出了GPT4,谷歌Bard、百度文心一言也緊隨其后,大型語言模型越來越多,功能越來越強大,但是我們的隱私地盤,是不是越來越少了?

浙江大學計算機科學與技術(shù)學院教授陳華鈞曾在接受潮新聞記者采訪時表示,數(shù)據(jù)安全、隱私保護都屬于安全AI或盡責人工智能的問題,現(xiàn)有的人工智能大模型大多存在這個問題。

“如果你的個人信息被學習進它的大腦中,隱私追溯比起以前的互聯(lián)網(wǎng)更加困難。至于它產(chǎn)生數(shù)據(jù)屬于誰,如何保存和監(jiān)管,目前在法律上還存在空白。” 陳華鈞說。

上周,出現(xiàn)技術(shù)漏洞,用戶看到他人的搜索記錄,首席執(zhí)行官Sam 發(fā)推文回應(yīng),修復(fù)程序已驗證完成,并對此“感覺十分糟糕”。

最近,Sam 在接受媒體采訪時也坦白,對AI技術(shù)以及它如何影響勞動力、選舉和虛假信息的傳播有些害怕,“我擔心這些模型可能會被用于大規(guī)模的虛假信息傳播。”

雖然語言對話模型在科技界受到熱捧,但不少科技巨頭卻心存警惕,甚至警告員工不要與其分享機密信息。

日前,據(jù)央廣網(wǎng)報道,微軟的工程師和亞馬遜的律師都曾警告員工,不要與分享“任何亞馬遜的機密信息,包括你正在編寫的代碼,因為他們可能會將其用于訓(xùn)練未來的模型。”

這些“無所不能”的類語言模型,也隱含著不少法律風險。

“對信息、數(shù)據(jù)來源無法進行事實核查,可能存在個人數(shù)據(jù)與商業(yè)秘密泄露和提供虛假信息兩大隱患。”北京盈科(上海)律師事務(wù)所互聯(lián)網(wǎng)法律事務(wù)部主任謝連杰在接受媒體采訪時說。

謝連杰分析,依托海量數(shù)據(jù)庫信息存在,其中包括大量的互聯(lián)網(wǎng)用戶自行輸入的信息,因此當用戶輸入個人數(shù)據(jù)或商業(yè)秘密等信息時,可能將其納入自身的語料庫而產(chǎn)生泄露的風險。雖然承諾刪除所有個人身份信息,但未說明刪除方式,在其不能對信息與數(shù)據(jù)來源進行事實核查的情況下,這類信息仍然具有泄露風險。

Sam 警告說,人工智能的廣泛使用可能會帶來負面影響,這需要政府和社會共同參與監(jiān)管。他呼吁反饋和規(guī)則對抑制人工智能的負面影響非常關(guān)鍵。