国模叶桐尿喷337p人体,国产乱xxⅹxx国语对白,国产精品人妻无码久久久郑州,国产一区二区内射最近更新,国产一区二区三区不卡在线看

首頁 人工智能發(fā)展與應(yīng)用產(chǎn)業(yè)觀察觀點正文

靠AI阻擊假新聞,或許沒那么樂觀

  近日,麻省理工學(xué)院計算機科學(xué)與人工智能實驗室宣布與卡塔爾計算研究所合作,研究出一種可以鑒別信息來源準(zhǔn)確性和個人政治偏見的AI系統(tǒng)。

  據(jù)報道,實驗室研究人員利用這個AI系統(tǒng)創(chuàng)建了一個包含1000多個新聞源的開源數(shù)據(jù)集,這些新聞源均被標(biāo)注了“真實性”和“偏見”的分?jǐn)?shù)。并且,AI系統(tǒng)對其所評估的媒介有廣泛的語境理解,不只單獨從新聞文章中提取特征值,而是兼顧了維基百科、社交媒體,甚至根據(jù)URL和Web流量數(shù)據(jù)的結(jié)構(gòu)來確定可信度。人類與假新聞的戰(zhàn)爭曠日持久,這次這個新的AI伙伴會幫助人類更快取勝嗎?

  做法不難,但需要豐富數(shù)據(jù)源

  談及AI的這個本事,中科視拓(北京)科技有限公司CEO劉昕表示:“相關(guān)做法并不難。我認(rèn)為這是一個非?;A(chǔ)的文本分類,看介紹這個系統(tǒng)會標(biāo)記出各類新聞是真的、假的、是否存在偏見,這是一個基礎(chǔ)的算法,就像標(biāo)記圖片中的貓、狗一樣,做出分類,然后可以識別一張新的圖片是貓還是狗,所以這本身是一個比較簡單的文本分類技術(shù)?!?/p>

  不過雖然原理不難,但實現(xiàn)難度不小。談到實用性,劉昕認(rèn)為,決定AI監(jiān)測假新聞效率的關(guān)鍵在于識別數(shù)據(jù)的量級是否足夠大、假新聞的來源和數(shù)量是否足夠豐富。要成功判斷出新聞是不是被捏造的,用來訓(xùn)練AI的假新聞的數(shù)據(jù)庫必須夠大。

  另外就是“如何抽取新聞文本中的信息”,是采用簡單的分詞的技術(shù)還是更高階的文本語義理解?!坝凶銐虻募傩侣動糜趯W(xué)習(xí),采用文本語義的信息抽取方式,可以讓AI的工作更有效、準(zhǔn)確率更有保證?!眲㈥勘硎?。

  在擴充數(shù)據(jù)量以及兼顧不同傾向的數(shù)據(jù)方面,這個新的AI系統(tǒng)作出有效改進(jìn):根據(jù)介紹,維基百科和推特被加入了系統(tǒng)的預(yù)測模型。正如研究者所說,維基百科頁面的缺失也許說明了一個網(wǎng)站是不可信的,相關(guān)網(wǎng)頁上也可能會提到這個問題的政治傾向如何。此外,他們還指出,沒有經(jīng)過驗證的推特賬戶,或者使用新創(chuàng)建的沒有明確標(biāo)注的賬戶發(fā)布的消息,真實的可能性很低。

  消滅假新聞,AI也無法手到擒來

  不只這個系統(tǒng),用AI阻擊假新聞的嘗試近年常有,不少大公司都有涉及。2017年初,F(xiàn)acebook曾推出Disputed標(biāo)簽,當(dāng)網(wǎng)站上某些新聞被認(rèn)為是錯誤的時,這個標(biāo)簽會出現(xiàn)在新聞下面,作為對讀者的提醒。Facebook使用AI檢查每天在Facebook上分享的數(shù)百萬個鏈接,識別出其中的可疑內(nèi)容,然后將它們發(fā)送給事實核查人員。當(dāng)事實核查人員確定其為假時,F(xiàn)acebook就會減少訪問范圍,降低其在用戶的信息流中的排序位置。聽來理想,但在去年底,F(xiàn)acebook已經(jīng)悄然放棄了這個標(biāo)簽功能,原因是這項努力并沒有帶來多大改善。追究可能的原因:確認(rèn)一則消息為假需要至少兩名事實核查員,這個應(yīng)用過程太慢;對某些新聞給予特殊標(biāo)記反而強化讀者對它的印象;假新聞被標(biāo)記,那部分為假或是無法證實真假的消息無法被標(biāo)記等。

  雖然存在各種想象中的可能性,AI在檢測假新聞方面也確實有一些優(yōu)勢和成效,但是,更核心的障礙或許在于連人類都無法在什么新聞是真是假、尤其是“偏見或傾向”的判斷上達(dá)成一致意見。中科院自動化研究所研究員王金橋表示,AI的判斷結(jié)果是訓(xùn)練的結(jié)果,而訓(xùn)練的數(shù)據(jù)來自人。如果機器學(xué)習(xí)的數(shù)據(jù)本身就是有偏見甚至偏差的,那AI的準(zhǔn)確性很難保證。

  據(jù)了解,他們的AI系統(tǒng)只需檢測150篇文章就可以確定一個新的源代碼是否可靠,其在檢測一個新聞來源是否具有高、低或中等程度的“真實性”方面的準(zhǔn)確率為65%,在檢測其政治傾向是左傾、右傾還是中立方面的準(zhǔn)確率為70%。如何在大量含混不明、挖苦反諷、諱莫如深的政治話語中判斷出傾向,目前來看,機器和人似乎一樣迷惘。

責(zé)任編輯:陳近梅

分享: