【聚焦中美】中國人工智能公司DeepSeek(深度求索)的人工智能(AI)模型本月初在海外發布後,至本周一成為蘋果iOS下載次數最高的免費應用程式。DeepSeek宣稱只用相較百分之五成本,開發效能足以媲美美國最先進的AI模型,但美國OpenAI日前稱DeepSeek可能盜用了其模型數據。事件在美國引起國安疑慮,當局急研策略應對。繼美國海軍要求人員禁用DeepSeek後,彭博社等美英傳媒昨(30日)引述消息報道,特朗普政府正考慮擴大對華晶片銷售限制至Nvidia現供中國可用於發展AI的H20晶片。獲特朗普提名出任商務部長的盧特尼克亦指控中國及DeepSeek「竊取美國技術」,強調須非常嚴格地執行晶片出口管制。
《紐約時報》周三引述OpenAI的聲明稱,知道中國組織「正積極利用方法,包括被稱為『蒸餾』(distillation)的方法,去複製先進的美國AI模型……我們注意到並正在審查DeepSeek可能不當提取我們模型的迹象,將在掌握更多信息後公布相關情況。」在機器學習領域,「蒸餾」指通過使用大型、預訓練模型的輸出來訓練另一通常較小模型,使其展現出類似能力。這種技術在機器學習領域常見,通常用於公司希望在資源有限的設備(如手機)上部署模型的情况。
「白宮AI和加密貨幣沙皇」薩克斯周二在霍士新聞訪問中稱,有「大量證據」顯示DeepSeek從OpenAI的模型「蒸餾」知識,形容有關做法有如「盜竊」,惟他未作詳細解釋。DeepSeek則未即時回應。《紐時》表示,OpenAI的服務條款有註明禁止任何人利用旗下系統數據,研發可對該公司作市場競爭的技術。
「美AI領先中國只剩3至6個月」
DeepSeek在官網上稱,旗下最強AI模型DeepSeek-R1在後訓練階段大規模使用強化學習技術,在數學、程式碼、自然語言推理等效能堪與OpenAI o1正式版「比肩」,薩克斯日前也表示,美國於AI方面領先中國的程度只剩3至6個月。DeepSeek宣稱只花了557萬美元(約4345萬港元)完成R1的訓練,成本為OpenAI旗下GPT-4o約5%,該公司去年亦曾稱只用了約2000枚次級Nvidia晶片訓練R1和v3模型,但真實性受質疑。美國時任拜登政府限制對中國出口Nvidia最先進型號晶片後,Nvidia轉供性能較次的H800和H20晶片。
特朗普日前形容,DeepSeek的突然冒起對美國「敲響警鐘」。彭博社昨率先引述知情人士報道,特朗普政府官員正研擬加強限制Nvidia晶片銷售往中國,主要聚焦於擴大禁售範圍至H20晶片,消息強調相關討論仍處於初步階段。
預告對華科技限制「非常強硬」
盧特尼克周三則在參議院確認其商務部長提名的聽證會上表示,不相信DeepSeek模型是「光明正大」地開發出來,並批評中國「只顧自己,並尋求損害美國利益」;稱DeepSeek的成功仰賴Meta的開源平台,以及囤積大量Nvidia晶片,指必須結束有關情况,他表示:「如他們要與我們競爭,那就讓他們競爭,但別再用我們的工具來跟我們競爭。」盧特尼克又指,如果成為商務部長,在對華晶片等科技限制方面立場將「非常強硬」。
(彭博社/路透社/紐約時報/國會山報/CNBC/財富)