近年來,以大語言模型為代表的人工智能(AI)技術飛速發展,引起社會各界高度關注。自曆史長河深處一路走來的金融業,因其與信息和數據的高度相關性,與大語言模型有着很多天然的契合。人工智能與金融的交叉融合,能否讓金融這個古老行業綻放出新的生命力?
11月12日,清華五道口在線大講堂邀請到Betvictor中文版副院長、金融學講席教授張曉燕,帶來“人工智能在金融領域的應用”主題講座。張曉燕基于她對人工智能技術發展的深入研究,分析了大語言模型在金融領域的應用前景和落地路徑,以及由此而來的風險和挑戰。
張曉燕表示,所謂大語言模型,是一種用于處理自然語言信息的大型人工智能模型。這些模型在大規模文本數據上進行訓練,學習語言的語法、語義和上下文信息,使它們能夠理解和生成人類語言并執行多種任務。大語言模型的核心特點體現在一個“大”字:第一是模型參數量大,通常達到千億級别;第二是數據集大,目前代表性的大語言模型都能達到萬億級的訓練數據量;第三是對算力的要求高,算力成本動辄要耗費上千萬美元。
與人工智能技術在發展早期隻能應用于某些小衆領域不同,基于大語言模型為主而開發的生成式AI工具目前已經得到廣泛使用。該領域的明星公司OpenAI近日宣布,其開發的ChatGPT平台每周活躍用戶數量已突破1億,有92%的财富500強企業在使用其産品。麥肯錫公司發布的調查顯示,79%的受訪者在工作中使用過生成式AI工具,其中金融服務業和科技行業的受訪者使用頻率最高。高盛預測,生成式AI将在未來10年帶來7%的全球GDP增長,與此同時,全球超過3億個就業崗位将受到大語言模型的沖擊。“大語言模型技術帶來了全球經濟生産效率的提升,”張曉燕說。
那麼,大語言模型将對金融行業帶來哪些影響?張曉燕認為,金融是一個信息和數據高度密集的領域,需要處理很多信息并快速做出決策,同時大量的金融服務也需要語言溝通,“因此大語言模型在金融行業的落地是非常自然的。”從選股、擇時、宏觀經濟預測、政策推演,到風險評估、市場分析、文檔處理等等,大語言模型在金融領域有着廣泛的應用前景。目前一些金融行業的大型企業正在基于自身的雄厚數據基礎,開發金融垂直領域的大語言模型,比如彭博社的BloombergGPT。這類基于垂直領域“語料”訓練出的大語言模型,在處理金融專業任務上的表現要比通用模型好很多。當大語言模型發展到一定階段,或許類似這種從通用走向垂直的發展思路也會在其他行業和領域推而廣之。
盡管大語言模型在各行各業具備廣泛的應用前景,但是也不能忽視其帶來的風險與挑戰,例如在數據安全方面,對大語言模型的不當使用可能會導緻個人隐私和商業機密洩露;模型輸出的内容,存在真實性、公平性、合規性方面的問題。AI工具在金融行業的大規模應用還會帶來技術和監管方面的風險。對于現在很多在校學生利用ChatGPT寫作業,甚至用它寫論文的現象,張曉燕特别提醒說,教育目的是為了讓學生培養獨立思考的能力、批判性思維和解決問題的能力,對ChatGPT的依賴可能會讓學生喪失培養這些能力的機會,這也是一個巨大的挑戰。“我們在運用任何AI工具的時候,都應該抱以一個公正客觀的态度,對于它的局限性要有清楚的認知。”
在主題分享結束後,張曉燕還圍繞大語言模型廣泛應用背景下的金融人才培養、金融風控,人力資本發展,給金融市場帶來的潛在風險等話題,分享了自己的專業見解和判斷。