來源:華興資本
自ChatGPT面世以來,AI行業再度被引爆,AI大模型作為新一代顛覆性技術同時掀起了一波又一波熱潮,頭部廠商與創業者紛紛涌入,備受業界矚目與市場追捧。
在這洶涌的狂歡背后,實則代表著AI發展的階躍,即AI直接創造了生產力,甚至被視為全新的生產力革命。那么,該如何理解現象級產品ChatGPT背后的技術演進?圍繞新一代AI及產業鏈,又有哪些率先落地的應用場景與投資機遇?
近日,華興新經濟基金科技與企業服務團隊通過對ChatGPT的成長歷史與技術路線進行了梳理與分析,并著重探討了生成式AI的技術突破與迭代方向,對未來核心落地場景及產業鏈機遇進行了深入研究和思考,匯總成本篇文章,期望能給大家帶來一些啟發與收獲。
ChatGPT是美國人工智能研究實驗室Open AI于2022年11月底推出的一款人工智能聊天機器人程序。上線40天ChatGPT月活破千萬,上線60天月活破億,漲粉速度遠超其他同類型產品,史上熱度最高。
從技術角度,ChatGPT是逐漸成熟的大模型(Transformer)路線與基于人類反饋的強化學習結合的產品。LLM發展的核心原因正是在于Transformer,使得用大規模的數據訓練模型具備了可能性,結合Alignment,實現了模型的社會化。以GPT為代表,AI進入新的發展階段,這背后技術上的變化突破主要體現在模型技術、參數、訓練數據、訓練方法的演化融合。
生成式AI與上一代AI的核心區別來自于以下幾個維度:
Transformer架構的應用使得大參數模型的研發具備了可能性:2017年谷歌提出Transformer模型,其并行化的語言處理方式使得并行計算的效率得到大幅的提升。基于Transformer模型,Open AI于2018年首次提出了GPT模型,能夠在無監督的情況下進行訓練,在大語料場景下能夠顯著地改善模型效果,正式將NLP(自然語言處理)帶入預訓練時代。
大規模數據的訓練及模型參數上升帶來模型涌現:對LLM而言,模型效果在很大程度上取決于參數量和其訓練的數據,其中訓練數據的數據質量的重要性甚至高于參數。進一步而言,訓練數據的清洗,模型參數的調整等不斷的嘗試,也是呈現出最優效果必不可少的步驟。而真正打開大模型之路的是模型的涌現能力。到2022年1月,思維鏈(一種提示詞的方法,不僅給出結果,也要給出計算過程)的引入,模型性能出現了明顯相變,明顯超越了小模型精調,大模型的研發路線進入了拐點時刻。
訓練方法的融合與改進:以ChatGPT為例,RLHF方法的引入,一方面能夠盡可能地對齊GPT的輸出,讓GPT具備更加友好或者說擬人化的語言邏輯,使得其具備與大眾溝通的基礎,符合監管要求,避免了重蹈上一代聊天機器人-泰依的覆轍;另一方面,人工反饋的引入,幫助模型更好地理解人類思維和意圖。總的來說,LLM的演化和進步,不是得益于某一種技術或者訓練方法,而是多種模型技術和訓練方法不斷工程化嘗試和融合的結果,是一種需要經歷時間的探索。
大模型具備高的算力門檻、創造力門檻、工程化門檻等,使得其必然是高舉高打的。從行業終局上看,大模型的終局會類似云,但考慮到不同的技術路線,會比云略分散,預期市場將有4-5家通用大模型公司,其中1-2家可能屬于創業公司的機會。
同時,市場會出現幾十億-百億級參數級別的服務于特定場景的所謂vertical的模型。考慮到更快的落地速度、更低的使用成本以及不亞于大模型的使用效果,疊加更好產品交互體驗,vertical的模型會憑借自己在特定場景的深耕而有自己的一方市場。
大模型是有邊界的:大模型類似于以往操作系統的存在,其發展起來的核心就要鑄造自己的生態,生態的繁榮才是其穩固且長期的壁壘。所以我們看到了Open AI與微軟的結合是一個雙贏,且是對雙方都有極大放大效應的組合。為了生態的繁榮,大模型一定有自己的不可為,同時,大模型的能力也是有邊界的。其本質是語言模型,對于規模導向、資源導向、產品體驗導向的領域,都不是未來迭代和發展的關鍵,也不是其能力所在。
大模型生態下的軟件和應用:LLM的發展本質帶來的是人與軟件的的交互形式發生了根本性的改變,所以從淺層來說,軟件公司需要思考的是在這個基礎上如何讓軟件的使用門檻更低,而更深層次需要思考的是,未來工作流會不會發生變革,而帶來Best Practice的變革,但基于新一代AI的infra的機會是確定的。
基于此,我們簡要梳理了四個基礎模型的篩選標準:
主流benchmark任務表現:包括其在主流的機器學習任務上的表現(與當下特定任務下表現最好的模型做比較);跨多模態/跨多語言的的能力、參數量/訓練數據質量等作為參照。
技術路線:雖然GPT的decoder-only暫時看起來熱度最高,但我們依然保持開放度,關注其他transformer變體的模型。
創始人:有工程化經驗的創始團隊。大模型本質是摸著石頭過河,有實際經歷的團隊在效率和潛在的成本上會有極大優勢。
綜合實力:融資能力強+其選擇的戰略伙伴。
因為底層大模型兼具數據壁壘和算力壁壘,對資金/算力要求高,且具備優勢的公司可建立起用戶調用和模型迭代之間的飛輪,預計頭部玩家較為集中。而目前國內市場格局仍還較為初期和分散,參與大模型的公司已超過30家,未來市場將面臨洗牌。
而應用層的落地,發展路徑可能會不太一樣。這主要在于應用層可基于行業Know-how及數據對模型進一步優化,新一代AI對人類思維理解能力躍升,而行業知識則可以使AI更具備行業專深的能力。打一個形象的比喻,上一代AI模型如果是中學生,這一代大模型即是一個具備通識教育的本科生,應用層要做的就是專才的研究生。伴隨專業知識輸入和行業Know-how輸入,AI可應對復雜度更高,且專業性也更強的工作任務,并能基于行業知識完成融會貫通。
目前在應用側,生成式AI在文本領域、圖像領域、代碼領域的應用已經初步成熟,而視頻/3D/游戲領域的成熟應用仍需要一定的發展時間。
以文字生成為例,上一代AI能力以輔助功能為主,如文字糾錯、轉寫等,但核心價值還是由人創造。新一代AIGC自動生成部分專業內容,核心是基于對上下文理解后的結構化寫作,類似于由輔助駕駛逐步走向自動駕駛,實現對業內初級專業人員的替代,如其可根據用戶需求完成對簡單專業材料的書寫,如突發新聞、網絡自媒體稿件等,乃至標書制作、招股書等各類有結構化規律的文書工作均可部分涉足,從而為文字作者、翻譯人員、插畫創作者、配音人員、音樂制作人、視頻編輯人員等提供增效。
目前,借助大模型在細分場景內完成深耕,海外已有相關獨角獸公司,我們看到如Jasper、Midjourney、Stability.AI等公司都在快速發展。而針對現有的各類軟件,也均有接入新一代AI能力,如Notion AI、Office Copilot、Github Copilot等,我們預計AI落地將同時對新場景和老場景下的軟件帶來深遠影響。
在應用側,新一代AI對現有應用層軟件也將帶來影響。一方面,新一代AI對偏管理屬性或行業知識屬性的賦能效果更明顯:此類軟件的核心價值在于提供基于行業Know-how或管理Best Practice的知識凝結,現在借助能力更強的AI功能可使軟件功能流轉更為智能。新一代大模型公司可完成AI功能的搭建,但無法短期快速積累行業Know-how或管理實踐,AI更多作為賦能者提升此類軟件的實際使用效果。
我們預期,對于具備行業數據+工作流能力的積累的軟件服務場景,在AI模型上完成Fine-Tuning,結合垂直行業知識+模型調優,可進一步在專業場景內使用,新一代AI的加入將大幅加強軟件的智能性。
另一方面,新一代AI可能對純工具類軟件具有負面影響。無Know-how或數據沉淀下的工具軟件的壁壘在大模型面前相對較低,特別是以上一代NLP技術為核心優勢的公司,其技術能力被相對拉齊,后續需盡快擁抱新一代技術。
綜上,在應用端,我們主要關注文字/圖像/代碼三個模態領域首先落地,新場景下關注結構化內容生成疊加高價值人力場景,可實現降本增效效果的機會;老場景下關注有潛力完成專有數據豐富積累+垂直行業Know-how積累的公司,推動公司后續跑起用戶-數據-效果的飛輪。
標簽: