金融行業正進入大模型時刻。百模大戰
2023年11月6日,金融招聯金融與中山大學聯合研發推出消費金融行業首個130億參數開源大模型——“招聯智鹿”。業正這是酣何合規繼度小滿、馬上消費和螞蟻金服之后,中突第四個公開的百模大戰消費金融行業大模型。
事實上,金融傳統金融機構也在加速大模型的業正應用落地。一些大型科技公司則在尋求與金融機構合作。酣何合規金融業“百模大戰”正酣。中突
金融大模型落地效果如何?百模大戰面臨的挑戰是什么?對未來金融生態有何影響?
為此,南方周末新金融研究中心研究員通過調研各主流金融機構,金融實測各金融機構App,業正并查閱2023年主要專業論壇嘉賓發言等發現,2023年下半年,酣何合規金融機構加快布局大模型,中突主要應用領域為智能客服、投資策略、風險控制和投顧投教等。
但目前科技公司與金融機構合作開發為主流模式。在此合作中,金融機構既擔心大模型賦能業務效果,又對數據安全及合規有所顧慮。
南方周末新金融研究中心研究員認為,金融業大模型仍處于試驗推廣階段,但趨勢不可逆轉。南方周末新金融研究中心研究員為此提出三點建議:促進“產學研”協同、加快立法、重視人才培養。
金融大模型有何特殊?國際人工智能權威雜志《Nature Machine Intelligence》(《自然機器智能》)認為,大模型指參數規模到達億級以上的“深度學習預訓練算法”。通用大模型需要巨大的計算資源和數據量,對技術團隊與資金支持要求極高,是國內外科技領域大廠的重點項目。
而垂直領域大模型專注于特定行業、領域或場景。因此,垂直領域大模型對算力和算法要求相對較低,但對特定領域數據要求較高。金融大模型即是典型的垂直領域大模型。作為現代高端服務業,金融行業具有數據量龐大、場景豐富等特點,與大模型對海量的高質量數據需求天然契合。因此,金融行業成為大模型率先落地的場景之一。
2023年下半年,國內金融機構加快布局大模型。除銀行外,保險公司和頭部券商漸次加入“百模大戰”。值得注意的是,消費金融公司也開始逐鹿大模型之戰。
南方周末新金融研究中心研究員不完全統計,在十九家系統性重要銀行中,過半銀行宣布已發布大模型或者正處于緊張籌備中。馬上消費、螞蟻金服和招聯金融等消費金融公司也相繼發布金融大模型,并自稱處于領先地位。
不同金融機構大模型有何異同?南方周末新金融研究中心研究員研究發現,從業界實踐來看,除工商銀行和農業銀行等少數頭部金融機構在開發金融行業大模型之外,其他中小金融機構普遍選擇與大型云廠商合作,針對某一業務場景進行試點。
南方周末新金融研究中心研究員進一步調研發現,智能客服幾乎成為金融機構標配,如,工商銀行“智慧柜員”、建設銀行“班克”、交通銀行數字員工姐妹花“姣姣”和“小姣”、江蘇銀行“智慧小蘇”等。此外,不同金融機構在投資、風控、投顧和投教等領域均有使用AI技術。
從開發模式看,與第三方合作仍是金融機構開發大模型的主流模式。金融機構目前主要合作對象為百度、騰訊、阿里和華為等科技巨頭,也有清華大學、北京大學等高校,還有恒生電子和宇信科技等金融科技公司。
相比于自主研發,合作研發性價比相對較高。度小滿CTO許冬亮表示,千億級別的通用大模型,訓練一次需要付出幾千萬的成本。而此前亦有家機構媒體報道稱,GPT-4一次訓練時間接近100天,訓練成本高達6300萬美元。換言之,一年最多訓練3次,每次花費約4.5億人民幣。
中小金融機構如何落地大模型呢?華為發布《數字金融:智領睿變,共建數智金融未來》報告顯示,業界公認當大模型參數量達到620億參數時,會出現能力噴涌現象。而目前很多開源大模型已經直接支持到百億甚至620億左右的參數集,大幅降低了AI訓練門檻。
從技術角度看,追求大模型參數規模并不是中小金融機構最優選擇。盡管理論上大模型參數規模越大,能力越強,但開發大模型目的是賦能業務、服務客戶,而不是炫技。南方周末新金融研究中心研究員認為中小金融機構不必“卷”技術,可針對某一業務場景,選擇十億級、百億級,甚至億級大模型試點,充分發揮中小金融機構組織靈活性優勢。
在AI加持下,金融行業數智化轉型正加速前行,但大模型對金融業務賦能有待進一步驗證。
南方周末新金融研究中心研究員調研發現,在合作模式下,金融機構關注的問題主要有三個:一是效率;二是安全;三是合規。
在效率上,前中后臺一體化的數智化整體解決方案是金融機構的核心訴求。在不久前的金融街論壇中,業界專家也共同探討這一問題。天風證券前副總裁翟晨曦在擔任第三屆全球金融科技應用場景大賽決賽評委時提出,金融機構面臨的最大問題是沒有人做集成,導致前中后臺數據接口不一,數據無法共享,在一定程度上導致內部溝通成本增加。
南方周末新金融研究中心研究員實測多款金融機構App發現,即使在大模型應用最廣的客服業務,仍面臨諸多問題。如,回答不準確、重復回答等。有些僅能接受“是或者否”的回答,而無法理解同義表達。此外,金融機構App存在利用智能客服過度營銷的現象,如,利用機器人電話頻繁騷擾。
許冬亮在金融街論壇中指出,在金融大模型場景端應用落地時,還需要處理好五大關鍵問題:一是基礎模型應該怎么選;二是金融機構自身的業務數據怎么融到大模型中;三是如何控制幻覺問題等模型缺陷問題;四是未來每個機構都會部署大模型的情況下,機構如何構建競爭壁壘。五是模型的安全合規如何保障。
在安全方面,金融機構擁有大量市場數據、交易數據和客戶數據。數據安全與隱私保護重要性不言而喻。
中國科學院院士何積豐曾在2023 INCLUSION·外灘大會上指出,大模型的安全問題主要是在未經同意的情況下,收集、使用和泄露個人信息。隱私問題既可能發生在訓練過程中,也可能發生在使用過程中,而大模型的生成能力則讓“隱私泄露”的方式變得多樣化,造成隱私保護更加困難。
在合規方面,雖然與云服務商合作,采購它們的模型訓練服務是金融AI訓練的捷徑,但金融業是強監管行業,涉及關鍵業務的數據往往因合規壓力而難以上傳公有云。
百融云創高級副總裁劉軍也曾談到,數據合規的風向主要有兩個,一是外部風險,包括數據運用是否做到依法合規,黑客及犯罪團伙的惡意攻擊等;二是內部風險,尤其是操作風險引發的數據外泄隱患。
南方周末新金融研究中心研究員認為,自2023年8月15日起施行的《生成式人工智能服務管理暫行辦法》平衡科技發展和監管需求,體現立法者鼓勵與監管并重的理念。期待《辦法》實施能為中國生成式人工智能服務領域的發展帶來更多的法律保障和制度創新。
仍處于試驗推廣階段的金融大模型如何走向產業級研發應用?
恒生電子調查發現,67%的金融機構傾向于應用層合作,最關注的應用領域是投顧助手(56%)、合規內控(44%)、投資研究(25%),而客戶服務僅占10%。這其中有客戶服務領域AI應用較深的因素,但更重要是體現了金融機構對大模型賦能核心業務的期待。
金融大模型走向產業級研發應重視生態共建。這點在2023年各大專業論壇上專家觀點中得到反復呼應。如,2023中國智能金融論壇甚至現場發起成立了“金融大模型生態計劃”。
許冬亮認為,金融大模型的產業應用需要場景應用方(金融機構)、模型提供方、訓練工具提供方等多方共建,共同參與。
人才是關鍵。在2023騰訊全球數字生態大會金融云專場上,騰訊云副總裁胡利明指出,現在頭部金融機構都在招算法博士,盡管他們可以借力云廠商,但最終金融機構還是要具備自主使用和創新的能力,主導AI大平臺的構建、優化及不斷疊加新的應用場景。
中國農業銀行研發中心北研平臺三部處長趙存超也曾表示,在金融業大模型的深度應用,尤其是嵌入到金融場景的深度應用,數據是核心,安全是前提,算力是基礎,場景是動力,人才是關鍵,協作是保障。
南方周末新金融研究中心研究員認為大模型應用是不可逆轉的長期發展趨勢,是加速數智金融轉型,推動金融高質量發展的關鍵戰略,但這是一項整體性、系統性、長期性工程,因此不能急功近利。
與此同時,合規與數據安全也不容忽視。在數智金融轉型過程中,金融機構需要警惕合規風險,平衡創新與安全的關系。在數據治理中,邊界清晰、規則明確是各方共識的基礎,否則,會放大分歧,阻礙發展。
基于此,南方周末新金融研究中心研究員提出三點建議:一是促進“產學研”協同。加強同業和跨界交流合作,制定標準,規范流程,共創共享。二是加快立法。歐洲人工智能法已落地,中國版人工智能法草案也在審議中。三是重視人才培養。人才儲備制約AI發展落地,因為不僅前期研發需要專業人才,后期運營及維護同樣需要人才。