作者 |張韶峰
【資料圖】
我們正迎來一個以大模型為核心的人工智能新時代
。金融是人工智能技術(shù)滲透最為廣泛的領(lǐng)域之一,大模型或許將在金融領(lǐng)域率先開啟“iPhone時刻”(意指革命性的轉(zhuǎn)變時刻)
。
自從OpenAI推出ChatGPT大模型開始
,通用大模型在全球范圍內(nèi)迎來爆發(fā)式增長
,市場上各類大模型層出不窮
,一時間宛如進入了“百模大戰(zhàn)”。但是,澎湃的市場情緒并沒有帶來應(yīng)用層面的火熱
,當(dāng)通用大模型運用在特定領(lǐng)域內(nèi)
,比如,醫(yī)療
、金融等,由于缺乏領(lǐng)域內(nèi)專業(yè)和龐雜的知識作為依托
,其能力表現(xiàn)往往不盡如人意
,大模型發(fā)展路徑也因此分出一條岔路。相比通用大模型
,針對特定行業(yè)訓(xùn)練的大模型在垂直領(lǐng)域的智能交互中表現(xiàn)更佳
。一個典型的例子是,彭博推出的大模型Bloomberg GPT在實時的金融數(shù)據(jù)處理等方面超越了ChatGPT
,展現(xiàn)出了更強的專業(yè)性。市場中越來越多的企業(yè)開始將目光投向了垂直領(lǐng)域的大模型
,在金融領(lǐng)域這一趨勢尤為強烈
。
01
兩次AI浪潮在金融領(lǐng)域疊加向前
在展望大模型在金融領(lǐng)域的應(yīng)用前景之前
,回顧一下人工智能與金融融合發(fā)展的歷史或許能給我們提供一個更加寬闊的視野
。
1956年,達特茅斯會議在一個小鎮(zhèn)召開
,會議首次使用了“人工智能”一詞,從此拉開了AI發(fā)展的序幕。但此后的幾十年間 ,人工智能發(fā)展幾經(jīng)波折,有過高潮
,也曾陷入過沉寂
。直到時間來到2013年,工程師通過深度卷積神經(jīng)網(wǎng)絡(luò)將圖像中對象分類的錯誤率降低到了18%為起點
,人工智能才開始又受到矚目。而讓AI真正走進大眾的視野
,莫過于2016年AlphaGo戰(zhàn)勝韓國圍棋棋手李世石這一標志性事件了
。
與此同時
,2013年金融領(lǐng)域也進入了新的歷史階段
,互聯(lián)網(wǎng)金融橫空出世了。此后十年
,一場涉及到整個金融產(chǎn)業(yè)的革命(包含銀行、保險
、互聯(lián)網(wǎng)金融
、消費金融、汽車金融等幾乎所有產(chǎn)業(yè)主體)進入了波瀾壯闊的十年
。
金融產(chǎn)業(yè)良好的數(shù)字化和信息化基礎(chǔ),為人工智能的發(fā)展奠定了基礎(chǔ)
。人工智能第一次發(fā)展浪潮與金融產(chǎn)業(yè)在過去十年形成了歷史性交匯
。
在第一次浪潮中,判別式AI是主角
。判別式AI的技術(shù)特性決定了它不需要窮盡所有信息
,而只需要部分較為精準的信息,即能給出明確的決策結(jié)果,進行“好”與“壞”的分類,“是”與“否”的判別,這對于彼時正快速線上化、數(shù)字化的金融機構(gòu)來說,判別式AI可謂占據(jù)了天時地利人和。
在判別式AI的驅(qū)使下,以銀行為代表的金融產(chǎn)業(yè)經(jīng)歷新舊范式的轉(zhuǎn)變
,金融數(shù)字化轉(zhuǎn)型正在各個層面如火如荼展開。經(jīng)過近十年的深耕和發(fā)展,判別式AI為金融機構(gòu)帶來了從文化思維、技術(shù)產(chǎn)品、管理流程、業(yè)務(wù)模式到人才生態(tài)等層面的重塑和變革。以2019年中國人民銀行印發(fā)《金融科技(FinTech)發(fā)展規(guī)劃(2019—2021年)》為標志,以保守穩(wěn)健著稱的金融機構(gòu)
,完成了對AI從懷疑、觀望到全面擁抱的轉(zhuǎn)變。而當(dāng)下
,以生成式AI為代表的第二波AI浪潮正席卷而來,技術(shù)引發(fā)變革的廣度和烈度都將遠超以往 。
02
大模型將為金融產(chǎn)業(yè)帶來哪些新變化
人工智能與金融的再次相遇,將會帶來哪些驚喜呢
?
以百融云創(chuàng)為例,百融云創(chuàng)基于深度學(xué)習(xí)Transformer框架
,結(jié)合NLP、智能語音等技術(shù)
,打造了場景驅(qū)動的產(chǎn)業(yè)大模型——BR-LLM
。百融云創(chuàng)自主搭建了大模型底層框架,通過深度微調(diào)能支持百億級參數(shù)的訓(xùn)練。
在AI開發(fā)層面
,大模型展現(xiàn)出強大的代碼自動化生成能力。在金融機構(gòu)中,傳統(tǒng)的機器學(xué)習(xí)模型開發(fā)在某種程度而言是一種“手工作坊”的模型,一個場景一個模型,模型之間的經(jīng)驗也不能互相積累和復(fù)用。大模型的自動生成能力將顛覆這一現(xiàn)狀,面向不同金融場景的業(yè)務(wù)訴求,通過大模型工程師只需要下達清晰的指令,用文字描述出需求,即能自動生成模型,極大提升機器學(xué)習(xí)的開發(fā)效率和生產(chǎn)模式。開發(fā)人員的角色也會隨之發(fā)生變化,如果說此前開發(fā)人員只需要做好技術(shù)的工作,有了大模型的加持,開發(fā)人員還要做好“提問者”的角色。在智能交互方面
,大模型能提供“真人級”對話效果,對客戶的語音識別準確率可達到99%以上。同時,大模型還有“高人一籌”的表現(xiàn)。比如,當(dāng)人工向客戶推銷金融產(chǎn)品時
,客戶問到一些如近十年某基金收益率這樣的專業(yè)性問題,工作人員無法及時給出準確的反饋,客戶可能就此流失。而大模型跨模態(tài)、跨語言的深度語義理解與生成能力,在處理復(fù)雜和專業(yè)性金融知識上,具有人工所不具備的能力。一家大型銀行動輒幾千萬的客戶,有了大模型的能力加持會為每名客戶提供一個7×24小時的專屬服務(wù)
,這將為金融客服、智能投顧
、產(chǎn)品營銷等帶來一個質(zhì)的飛躍
。
在分析決策方面
,以判別式AI為代表的小模型已經(jīng)發(fā)揮了重要作用
,大模型的進場將進一步激發(fā)小模型的能量。
數(shù)字化轉(zhuǎn)型的快速推進
,使得銀行內(nèi)部形成了大量的非結(jié)構(gòu)化數(shù)據(jù),這對信息質(zhì)量要求比較高的判別式AI而言是一片無法觸及的領(lǐng)域。當(dāng)訓(xùn)練的信息量超過一定閾值,大模型就會出現(xiàn)“涌現(xiàn)現(xiàn)象”,即“在較小的模型中不存在,但在較大的模型中存在的能力”。大模型能夠憑借強大的信息挖掘能力
,喚醒金融機構(gòu)大量沉積的信息,就像是一塊巨大的磁石,做關(guān)鍵信息的抽取,為判別式小模型進行賦能。比如,在風(fēng)險決策、信用評估、反欺詐等場景下,大模型能豐滿信息的維度,挖掘出小模型無法覆蓋到的區(qū)域。大模型對于小模型并非是替代或“消滅”,相反,兩者將是相互協(xié)作的關(guān)系,大模型與小模型相互搭配,將大大提升金融決策的精準度和效率。
03
大模型“大”非萬能
與普通模型相比
,大模型具有更加復(fù)雜和龐大的網(wǎng)絡(luò)結(jié)構(gòu)
、更多的參數(shù)和更深的層數(shù)
。但更大規(guī)模,并不等于更強模型能力
。
產(chǎn)業(yè)大模型考驗的是算力+行業(yè)knowhow+模型精調(diào)的綜合能力。其中行業(yè)knowhow尤為關(guān)鍵
,這是專家經(jīng)驗
、行業(yè)數(shù)據(jù)、組織能力
、工程能力的綜合體
,而這也恰恰是垂直企業(yè)的競爭優(yōu)勢所在。
比如
,在銀行運營環(huán)節(jié)
,由于模型都是黑盒模式,由模型制定出的營銷策略
,很難讓一線執(zhí)行的客戶經(jīng)理完全信服
,當(dāng)模型制定的策略置于現(xiàn)實情況產(chǎn)生了偏差,此時該如何協(xié)調(diào)客戶經(jīng)理與AI之間的關(guān)系
?或者由于外部環(huán)境發(fā)生變化
,如疫情對居民收入帶來了影響,金融機構(gòu)原有的信貸模型與現(xiàn)實情況就會產(chǎn)生偏差
,此時要如何優(yōu)化原有的參數(shù)
?如果僅有大模型而沒有足夠深入的產(chǎn)業(yè)knowhow,是遠遠不夠的
。
比如
,在某中小銀行的服務(wù)中,百融云創(chuàng)要從數(shù)字化轉(zhuǎn)型總體規(guī)劃入手
,逐步深入到
,產(chǎn)品和業(yè)務(wù)等多個層面。有時要協(xié)同科技部門、業(yè)務(wù)部門等多個部門,并搭配非常深厚的產(chǎn)業(yè)視野,才能真正深入場景
,直抵產(chǎn)業(yè)的核心。
當(dāng)然
,必須指出的是