
去年六月,韓國政府發起了一項競賽,旨在開發基于韓國技術的全新獨立人工智能模型。在目前由中美科技企業主導的全球AI格局下,此類本土工具對確保韓國技術自主至關重要。
然而最新的實踐證明,想要“獨立自主”地實現這一點遠非易事……
財聯社去年8月曾介紹過,韓國科學技術信息通信部當時宣布,已選定5支精銳團隊參與“自主AI基礎模型”項目,分別是Naver Cloud、Upstage、SK Telecom、NC AI和LG AI研究院。
然而,在這場為期三年打造韓國“AI國家隊”的競賽中,五家入圍企業中已有三家目前被發現,至少使用了部分外國人工智能模型的開源代碼——尤其是中國模型的代碼。
相關企業和人工智能專家辯稱,完全摒棄現有AI開源模型,并試圖從零開始構建一切的做法毫無意義。
哈佛大學電氣工程教授Gu-Yeon Wei指出,要求人工智能模型開發過程中所有代碼均由本國編寫并不現實。他熟悉韓國此次AI競賽的情況,但未直接參與任何參賽企業。Wei表示,“放棄開源軟件,就意味著放棄巨大的利益。”
但另一些韓國業界人士則指出,任何使用外國工具的行為都可能帶來潛在的安全風險,并削弱培育真正屬于本國人工智能模型的希望。
目前,在全球范圍內,各國正日益尋求降低對外依賴,并提升自身在人工智能領域的自主能力——這項技術可能深刻影響其經濟競爭力和國家安全。而擁有眾多芯片巨頭、軟件公司及政治支持的韓國,已成為所謂“主權人工智能”最積極的倡導者之一。
智譜、阿里、DeepSeek成了韓國模型“效仿”對象?
據悉,近期率先引發爭議的,是入圍“五強”決賽圈的Upstage公司。
其競爭對手Sionic AI的首席執行官指出,Upstage公司的AI模型部分組件與智譜AI的開源模型存在相似之處,且部分代碼中仍保留著智譜AI的版權標記。
“令人深感遺憾的是,莊閑和游戲app一個疑似基于中國模型微調的版本竟被提交至(韓國)納稅人資助的項目中,”Sionic首席執行官Ko Suk-hyun在領英發文寫道。Sionic雖也參與了這場韓國AI競賽,但未能進入決賽圈名單。
對此,Upstage舉行了一場直播驗證,分享了其開發日志,以證明其模型是使用自己的方法從空白狀態開發和訓練的。不過,用于運行模型的推理代碼,確實使用了源自智譜AI的部分開源組件——當然,這些開源組件在全球范圍內本身已被廣泛使用。
這一審查此后也引發了對其他決賽圈入圍者的更嚴密審視。
據悉,Naver的AI模型被指控其視覺和音頻編碼器,與中國阿里巴巴和OpenAI的產品有相似之處。
SK Telecom也面臨批評,被指其運行AI模型的推理代碼與中國初創公司DeepSeek的模型代碼相似。
Naver隨后承認使用外部編碼器,但稱采用標準化技術是戰略決策,并強調模型核心引擎(決定其學習與訓練方式)完全由公司自主研發;SK Telecom也提出了類似辯解,著重強調其模型核心的獨立性。
據悉,韓國的這場“AI國家隊”選拔,旨在到2027年選出兩家本土勝出企業——其AI模型性能需達到OpenAI或谷歌等行業領軍者的95%以上水平。獲勝企業將獲得政府資金支持用于數據采集和人才招聘,并可優先獲取政府采購的AI計算專用芯片。按原定計劃,韓國政府將在本周從五家決賽入圍者中淘汰一家。
值得一提的是,此次韓國AI模型競賽的規則本身,并未明確規定是否允許使用外國企業的開源代碼。負責監督競賽的韓國科學技術部在爭議爆發后未發布新指南。韓國副總理兼科學技術信息通信部長官裴慶勛則對圍繞該起事件的激烈辯論表示歡迎。
“目睹當前人工智能產業掀起的技術論戰,我反而看到了韓國人工智能的光明前景,”裴慶勛本月早些時候在社交媒體發文稱。
首爾國立大學人工智能研究院院長Jae W. Lee對此表示,人工智能模型是通過設定和微調內部數值來生成輸出結果的,而那些受到質疑的決賽圈入圍者模型中,這些核心任務似乎并未依賴外國工具。