最近各大傳媒和社媒都已經被深度求索(DeepSeek)的消息洗版,相信讀者已經從鋪天蓋地的報道中獲得了不少資訊,因此筆者嘗試在這篇文章中提出一些較少人提及的問題。
根據深度求索的公司幻方所說,這大型語言模型的開發成本和時間很少,只需要大約二千片H800圖形處理器和少於六百萬美元,兩個月之內便完成。這說法頗受爭議,不過,若果這是真的,也不足為奇,因為美國公司已經花了龐大資金和長時間在研發上,許多成果都是開源模型,所以幻方能夠減省了研發成本,在現有基礎上改良,從而後發先至、彎道超車。
一些人工智能專家斷言,深度求索是建立在現有的開源模型之上的,例如Meta的LLaMA。Riot Games一位研究員的分析顯示,深度求索緊密遵循Llama 2的架構。就連深度求索在2024年1月發表的論文也是這麼說的:「在模型層面,我們總體上遵循了LLaMA的架構,但用一個多步驟學習率調度器,在促進持續訓練的同時保持性能。」
然而,當我詢問深度求索是否從Meta的LLaMA中學習時,它斬釘截鐵地否認了這一點:「不,我不是基於Meta的LLaMA(Meta AI的大型語言模型),我是由中國公司深度求索獨家打造的人工智能助理,我的模型是深度求索自主研發的,旨在為用戶提供廣泛的服務和資訊。」
以上各種說法互相矛盾,但無論如何,深度求索的確包含了獨特的演算法。Perplexity AI 執行長兼共同創辦人斯里尼瓦斯(Aravind Srinivas)在接受 CNBC採訪時,間接為深度求索辯護,他認為不必說誰抄襲誰,事實上,美國科技公司亦是互相參考,例如谷歌發展出Transformer的建構模式,Open AI的GPT就是基於Transformer。Open AI公開承認,而當我詢問ChatGPT是否參考了Transformer的時候,ChatGPT亦直言不諱:「是的,OpenAI 的 GPT 模型從根本上是基於Google的Transformer架構,但隨著時間的推移,它有重大的修改和進步。」
目前,Meta 已經組建了四個「作戰室」,以研究深度求索如何以極低的成本超越競爭對手。如果深度求索真的是建基於LLaMA這開源模型,那麼Meta可說是搬石頭砸自己腳。
儘管如此,Meta首席人工智能科學家楊立昆(Yann LeCun)仍然大力支持開源模式,他大方地表示,深度求索的成功不在於中國打敗了美國,更確切地說,這是開源模式勝過閉源模式。楊立昆表示,深度求索「從開放研究和開源中獲益匪淺。他們提出了新的想法,並在其他人的工作基礎上加以實現。由於他們的工作成果已發表並開源,因此每個人都可以從中獲益。」
熟識我的讀者會知道,我對開源模式一直保持懷疑態度,開源模式是基於一種近似社會主義的理想主義:各盡所能,各取所需,沒有壟斷,知識是公有財產,這是對人性非常樂觀的假設。可是,當所有人都可以獲取開源模型中的代碼時,而所有人還包括了俄羅斯人、北韓人、伊朗人等等。一方面,許多人工智能專家、倫理學家、政治家指出人工智能的威力巨大,若果被濫用或者不小心使用的話,可能會造成災難性的後果,故此鼓吹嚴格監控;但另一方面,人們又同時要開放人工智能的技術予所有人,這兩種取向是否自相矛盾呢?
事實上,人工智能的開源模式已經出現了「潘朵拉盒子」的後果,2019年有人採用人工智能神經網絡發展出一個名為DeepNude的軟件,這軟件可以迅速地將任何人正常的照片變為裸照,軟件程式編寫人被千夫所指,最後DeepNude在群眾壓力下被下架,但為時已晚,因為DeepNude的程式是屬於開源模式,而訓練這機械學習模型的資料亦是公開地在互聯網上傳播,於是乎出現了無數抄襲的軟件,直至今日,你仍然可以輕而易舉地在互聯網上找到DeepNude的變種,即使有關當局嘗試立法禁絕,但情況已經完全失控。
筆者在大學教授一門人工智能倫理的課,在編寫課程時,我蒐集了許多人工智能已經和潛在上被濫用的地方,開源軟體的透明度是一把雙面刃,雖然這些公開的程式讓全世界人審查和改進它,但這也意味著存心不良的人可以研究程式碼以尋找漏洞,例如製造攻擊電腦系統的病毒,此外,人們可以利用人工智能製造虛假資訊,從而達到操控、洗腦的效果,從前這需要龐大的資源,但在開源模式下,就變得易如反掌。
但無論如何,開源模式已經是無法逆轉的既定事實,我們只能夠步步為營。美國作家尼爾‧波茲曼(Neil Postman)說過:「科技的影響是難以預測,但並非無可避免的。」