韓國AI自主夢陷抄襲風波
韓國「國產AI模型大賽」陷抄襲風波:自主技術與開源代碼的邊界之爭
2023年6月,韓國科學部發起「國產AI模型大賽」,目標在三年內打造性能達標OpenAI與谷歌95%水準的「純韓技術」大型AI模型。政府承諾為獲勝企業提供公有數據、人才資源及AI晶片支援,以降低對中美技術的依賴。然而,計畫推行不到一年,便因多起「抄襲」爭議陷入輿論風暴。
進入比賽五強的企業中,有三家被曝使用來自中國與美國的開源程式碼。其中,新創公司Upstage的參賽模型Solar Open 100B遭競爭對手Sionic AI執行長高錫賢於LinkedIn公開指控,指其與智譜AI的GLM 4.5 Air模型相似度高達96.8%,且原始碼中仍殘留版權標記。高錫賢質疑Upstage「用納稅人資金提交偽國產作業」,暗示僅對現有開源模型進行微調與包裝。

面對指控,Upstage迅速召開直播記者會,執行長金聖勳出示訓練日誌,證明核心模型係從零開始訓練,僅推理架構採用智譜AI的開源組件。他解釋,LayerNorm數值高度相近,是因大型語言模型若使用類似的Transformer或MoE架構,並以相近資料訓練,統計特徵將自然收斂至相似結果。隔日,高錫賢公開道歉,承認未經充分查證即發文,做法「確有欠妥」。
Upstage事件引發連鎖效應,其他決賽企業亦遭深度審查。Naver被發現其視覺與音訊編碼器設計與阿里巴巴「通義千問」高度相似;SK Telecom的推理程式碼則疑似與DeepSeek模型「撞車」。兩家公司皆坦承使用部分開源模組,但強調核心訓練引擎為自主開發,外部元件僅用於標準化處理,屬業界普遍做法。
學界辯論:何謂「自主AI」?完全自研是否現實?
首爾大學AI研究院院長李在儒公開支持涉事企業,表示受質疑的模型「均從零訓練,未直接複製外國模型權重」。然而,輿論質疑聲仍未平息:若開源代碼占比過高,韓國「主權AI」戰略是否僅具象徵意義?
「自主AI是否需完全自寫每一行程式碼?」成為學術界討論焦點。哈佛大學教授韋巨賢直言:「要求100%自研不切實際,放棄開源等同於放棄技術紅利。」但反對者警告,即使僅使用周邊開源元件,也可能引入後門風險或供應鏈依賴,削弱國家級AI的戰略獨立性。

制度缺失暴露韓國AI發展瓶頸
目前,比賽規則並未明文禁止使用開源代碼,科學部亦未發布進一步指引。部長裴慶勳僅回應「樂見技術辯論」,並稱「韓國AI未來光明」。
評論指出,Upstage風波凸顯韓國AI生態兩大問題:一是競賽規範對開源使用的定義模糊,二是政府、企業與學界對於「獨立模型」缺乏共識。此次爭議或將倒逼韓國重新審視「主權AI」戰略,在技術自主與國際合作之間尋求更精細的平衡。
