26/07/2024
Meta AI開源逆襲!朱克伯格推最強免費AI模型Llama 3.1!衝擊OpenAI閉源AI生態圈
OpenAI以「開放」之名創立,但最終卻走上「封閉」之路。ChatGPT爆紅以來,其背後的AI模型全屬閉源平台,沒有公開程式碼。但Facebook母公司Meta卻反其道而行,從一開始就以開源姿態跨入生成式AI領域,剛於7月釋出的「Llama 3.1」,更號稱是當今最強的開源模型,性能直逼GPT-4o!Meta執行長朱克伯格豪言,這是劃時代的開源AI模型,並強調開源才是AI的未來。到底Meta能否以開源策略顛覆整個AI產業的格局呢?
Llama 3.1擁有4,050億項參數
2024年7月23日,Meta宣布推出當今最大規模的開源(Open Source)模型Llama 3.1系列,透過16,000顆NVIDIA H100 GPU訓練而成,其中405B版本擁有4,050億項參數,使其性能可跟OpenAI GPT-4o等最先進的閉源(Closed Source)模型相提並論。
Meta執行長馬克‧朱克伯格(Mark Zuckerberg)在新模型釋出後發布長文《Open Source AI Is the Path Forward》,強調Llama 3.1 405B是首個達到頂級水平的開源AI模型。Meta官方表示:「直至目前為止,開源模型在功能和性能上大多落後於閉源模型。現在,我們正迎來一個由開源引領的新時代。」
朱克伯格在《Open Source AI Is the Path Forward》文末表示:「我相信Llama 3.1將會是業界的一個轉捩點,讓大多數開發者開始轉用開源技術,而且我預期這趨勢將會持續成長。」(圖片來源:朱克伯格FB帳戶)
朱克伯格進一步表示,開源模型不但成本效益比閉源模型為高,開源特性更使它成為微調和提煉作小型模型的最佳選擇,並揚言Llama 3.1 將會「超越坐擁逾一億用戶的ChatGPT」,躍居為2024年底最多人使用的AI工具。
根據Meta發表的測試圖表,Llama 3.1 405B的性能與GPT-4相若,但跟GPT-4o和Claude 3.5 Sonnet相比卻互有勝負。(圖片來源:Meta官方網誌)
開源AI幫助Meta減輕開發成本
Llama 3.1的誕生,除展現Meta本身在AI領域的野心外,更試圖引領AI產業走向另一個可能的發展方向。其實,Meta一直是開源的擁護者,譬如開源的機器學習程式庫PyTorch正是由Meta AI團隊開發,所以開源本來就是其拿手好戲。但問題是,Meta始終是一家商業機構,為何要提供免收費的開源AI模型?
首先,開源有助減輕公司的開發成本。朱克伯格以Meta的「開放運算計劃」(Open Compute Project)為例,向外發布其伺服器、網絡和數據中心的設計資料,並讓供應鏈企業幫助改進設計,因而替公司減省了數十億美元的成本。
朱克伯格認為,在開源模式下,可以匯集全球開發者的力量,致力於改善AI模型的設計,令AI研發成本得以大幅降低。根據Meta資料,Llama模型下載量已逾1億次,可見其開源策略確實吸引了一大群開發者加入開源AI社群。
開發者現已可在 llama.meta.com 下載Llama 3.1模型;一般用戶也可以透過 Meta.ai 使用聊天機械人,惟暫時僅開放給美國用戶體驗。(圖片來源:翻攝Meta.AI聊天介面)
開源可創造公平開放AI生態圈
再者,開源可以創造一個公平與開放的AI生態圈,避免AI技術被一小撮大企業所把持。目前大部分AI模型都是閉源平台,讓人無法完全了解其技術細節,所以外界很難對這些模型展開有意義的研究。如要自建AI模型,更需要龐大的運算資源和高深的機器學習專業知識,開發門檻極高,讓中小企難以入手。
以Facebook受到App Store限制為例,朱克伯格指出,Apple向開發商徵收「蘋果稅」,並任意定下多項嚴格規則,窒礙Meta與其他公司的創新能力。他相信,必需透過開源手段,創造公平開放的競爭環境,讓大中小企享有均等的發展機會,方可讓包括Meta在內的公司取得技術進步,而不會被少數科技巨頭的閉源生態圈所限制。
近年,AI領域湧現了不少受Llama啟發的開源模型,例如:史丹福大學以LLaMA作基礎,花上不到600美元,開發出Alpaca模型。其後,史丹福大學再跟加州大學柏克萊分校、以及聖地牙哥分校合作,基於Llama研製出Vicuna模型,產出內容可達ChatGPT的9成質素,但訓練成本卻僅需300美元。Meta表示,開源AI社群已在Hugging Face平台上推出逾7,000個Llama衍生作品。
資訊安全或成開源AI最大隱憂
然而,開源背後的最大隱憂是資訊安全。開源模式雖然可以吸引很多人參與開發,但當中難免良莠不齊;倘若任何一段開源程式碼有漏洞,就有可能令整個軟件供應鏈陷入資安危機。電子設計自動化公司新思科技(Synopsys)於2023年分析1,703個程式碼庫後,發現76%是開源的,惟這些開源程式碼中84%存有保安漏洞,較2022年上升4%,可見開源漏洞持續增加中。
此外,有論者認為,開源AI等同把核彈按鍵發送給每個人,令任何人都有機會自製AI模型做出不負責任、具破壞性的行為。Meta官方強調,為免開源模型被濫用,開發者必需詳細交待如何使用Llama,始能獲得下載許可。Meta 首席AI 科學家楊立昆(Yann LeCun)曾點名批評OpenAI、DeepMind、Anthropic執行長,認為他們散播開源恐懼,意圖阻撓開源AI發展。
如今開源AI與閉源AI之爭,就像是當年《Linux》與《Windows》作業系統的角力。回顧歷史,最終由閉源的《Windows》成為大贏家,開源的《Linux》敗走PC平台,但其衍生作品《Android》卻在手機平台發揚光大。究竟未來AI平台是否仍會由閉源獨霸市場,抑或由開源逆轉取勝,還是雙方可以共存共榮?這場AI競賽絕對值得我們持續關注。
延伸閱讀:
GPT-4閉源惹議!Google推開源模型Gemma,為AI競爭添新變數,扭轉OpenAI獨大局面?
打破美國AI霸權?法國初創Mistral AI走開源路線,降低模型訓練成本,劍指OpenAI龍頭地位!
【你點睇?】《施政報告》提出醫療改革,盧寵茂表示日後普通科門診擬只接受弱勢群體,你是否支持?► 立即投票