fb涉誇大篩檢仇恨帖AI技術成效

【社交网媒】《華爾街日報》（WSJ）周日（17日）報道，社交網站facebook（fb）內部文件顯示，該公司的人工智能（AI）技術演算法不夠強大，未能有效自動將仇恨和暴力言論等有問題內容屏蔽，自動清除仇恨言論比率甚至只有個位數，與高層向外宣稱的說法不符。

內部文件指AI僅刪約2％帖

據《華爾街日報》取得的fb內部文件顯示，fb的AI無法持續穩定地找出種族仇狠言論、第一身射擊影片，令內部研究人員百思不得其解。其中一個例子是，AI將人們洗車的影片誤以為第一身射擊的影片，另一例子是它誤以為一段射擊影片是車禍片段。

在仇恨言論上，文件顯示fb員工估計公司只移除了不足5%的違反平台守則內容，帖文者的帳戶也往往沒有被懲罰。文件顯示，fb兩年前將花在人工審查仇恨言論的時間減少，令公司更依賴AI代為執行審查，然後在公開數據中誇大AI「執法」的成功率。報道稱，一名高級工程師和研究科學家在2019年中曾估計，被AI系統自動識別後刪除的仇恨言論，僅佔平台內總數約2%。今年3月，fb另一員工小組得出類似結論，指AI刪除的相關言論只佔所有仇恨言論的3%至5%，佔所有違反fb反暴力和煽動內容的0.6%。

有關數字與fb高層向外宣稱的說法有很大出入。fb總裁朱克伯格曾表示，在2019年底時，fb可以利用AI偵測出絕大部分有問題的內容。fb又曾聲稱，直到今年較早時，近98%的被刪除仇恨言論都是在有用戶舉報前先由AI發現。

fb：數據未反映降內容排序效用

fb發言人斯通（Andy Stone）稱，這些百分比顯示AI移除的內容，但未包括公司令用戶減少看到這類內容而採取的行動，例如將這些內容在動態消息（news feed）的次序降低。fb強調，降低內容次序的做法，令違規內容被看到的機會減少，散播的程度也因此降低，那是公司認為最重要的做法。

（華爾街日報）

內部文件指AI僅刪約2％帖

fb：數據未反映降內容排序效用

Related posts

被指破壞網絡生態 小紅書遭處罰 網信辦：熱搜榜頻現明星動態等「不良信息」內容

社交平台AI深偽影像充斥 成以伊另一戰場

路透新聞研究所調查：社交平台成美民新聞主渠道

被指破壞網絡生態小紅書遭處罰網信辦：熱搜榜頻現明星動態等「不良信息」內容

社交平台AI深偽影像充斥成以伊另一戰場