直擊WAIC丨對(duì)話?cǎi)R上消費(fèi)CIO蔣寧:大模型技術(shù)在金融行業(yè)落地還存在四個(gè)挑戰(zhàn)

2023-07-08 22:05:35 21世紀(jì)經(jīng)濟(jì)報(bào)道 21財(cái)經(jīng)APP 李覽青

21世紀(jì)經(jīng)濟(jì)報(bào)道記者李覽青 上海報(bào)道

在2023年世界人工智能大會(huì)上,大模型技術(shù)是當(dāng)之無(wú)愧的“話題王”。在通用大模型向前疾馳的同時(shí),大模型技術(shù)如何應(yīng)用于金融等垂直領(lǐng)域,再次成為業(yè)界熱議的問(wèn)題。

7月6日-8日,在世界人工智能大會(huì)舉辦期間,21世紀(jì)經(jīng)濟(jì)報(bào)道記者專訪了馬上消費(fèi)金融首席信息官蔣寧,他坦言,如今市場(chǎng)廣泛討論的大模型是生成式模型,而金融行業(yè)真正需要的是多種模型的組合式AI系統(tǒng),如今大模型技術(shù)在金融行業(yè)的落地還存在四個(gè)方面的挑戰(zhàn)亟待突破,目前為解決金融機(jī)構(gòu)的魯棒性決策問(wèn)題,依然需要實(shí)時(shí)人機(jī)協(xié)作的機(jī)制參與。

從“小學(xué)生”開(kāi)始培養(yǎng)

《21世紀(jì)》:模型和強(qiáng)化學(xué)習(xí)并不是新鮮詞,大模型技術(shù)和過(guò)去相比,在技術(shù)層面帶來(lái)了怎樣的變革?

蔣寧:強(qiáng)化學(xué)習(xí)是發(fā)展很久的領(lǐng)域,從AlphaGo到現(xiàn)在OpenAI的ChatGPT,強(qiáng)化學(xué)習(xí)也在發(fā)生巨大的變化。

強(qiáng)化學(xué)習(xí)簡(jiǎn)單來(lái)說(shuō)是基于人輸入的策略,機(jī)器在執(zhí)行過(guò)程中不斷地調(diào)整這個(gè)策略。AlphaGo當(dāng)年最偉大的突破在于,過(guò)去在封閉環(huán)境下機(jī)器可以通過(guò)強(qiáng)化學(xué)習(xí)測(cè)算博弈獲勝的概率,得到一個(gè)概率結(jié)果,而AlphaGo可以在兩者博弈的動(dòng)態(tài)環(huán)境下測(cè)算勝率,但它不知道最終的結(jié)果。

今天大模型技術(shù)的強(qiáng)化學(xué)習(xí)是一個(gè)開(kāi)放系統(tǒng),每個(gè)用戶輸入的內(nèi)容指令不一樣,機(jī)器不知道對(duì)方會(huì)問(wèn)什么問(wèn)題,也不知道該如何更好地回答這個(gè)問(wèn)題。但在開(kāi)放系統(tǒng)下,在不知道對(duì)與錯(cuò)的情況下,它通過(guò)獎(jiǎng)勵(lì)函數(shù)評(píng)估出哪個(gè)是更好的答案,它不斷通過(guò)強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)“越用越聰明”,這就是持續(xù)反饋機(jī)制,這是OpenAI的突破。

《21世紀(jì)》:國(guó)內(nèi)已經(jīng)開(kāi)啟“千模大戰(zhàn)”,今天人工智能大會(huì)上也有很多大模型產(chǎn)品發(fā)布,在您看來(lái),您是如何看到國(guó)內(nèi)各家的大模型與Opan AI之間的差異?

蔣寧:我認(rèn)為目前大模型的核心技術(shù)能力,是在于持續(xù)反饋機(jī)制。打個(gè)比方,企業(yè)推出的大模型相當(dāng)于博士生畢業(yè),如果沒(méi)有高質(zhì)量的語(yǔ)料數(shù)據(jù)訓(xùn)練來(lái)讓大模型進(jìn)行持續(xù)反饋,那這個(gè)博士生的知識(shí)水平就停留在畢業(yè)時(shí),很快就會(huì)被其他擁有自我反饋機(jī)制的AI追趕上。而OpenAI的大模型是從“小學(xué)生”階段就經(jīng)歷了全社會(huì)全平臺(tái)最好的教育,通過(guò)巨量數(shù)據(jù)來(lái)進(jìn)行持續(xù)反饋與強(qiáng)化學(xué)習(xí),這樣才能實(shí)現(xiàn)“越用越聰明”。

金融領(lǐng)域大模型落地遇四大挑戰(zhàn)

《21世紀(jì)》:今年WAIC大模型技術(shù)非?;鸨?,你認(rèn)為金融行業(yè)適合大模型技術(shù)應(yīng)用嗎?

蔣寧:大語(yǔ)言模型技術(shù)出世后,對(duì)金融行業(yè)的人工智能技術(shù)應(yīng)用是“強(qiáng)心劑”,首先金融行業(yè)有三個(gè)特點(diǎn)。

第一,第一,金融行業(yè)天然是數(shù)據(jù)密集型、技術(shù)密集型行業(yè),其對(duì)數(shù)據(jù)和技術(shù)的使用在各行各業(yè)中都是最廣泛地。第二,金融行業(yè)目前面對(duì)的挑戰(zhàn)很多,如銀行線下網(wǎng)點(diǎn)的價(jià)值傳遞效率問(wèn)題、用戶體驗(yàn)問(wèn)題,都需要機(jī)構(gòu)持續(xù)創(chuàng)新。第三,金融行業(yè)一直在探索數(shù)據(jù)資產(chǎn)化,挖掘數(shù)據(jù)價(jià)值,在風(fēng)險(xiǎn)、營(yíng)銷、運(yùn)營(yíng)等方面進(jìn)行嘗試。

《21世紀(jì)》:但是我們看到大模型技術(shù)目前在金融行業(yè)落地場(chǎng)景還是很有限,你認(rèn)為存在哪些挑戰(zhàn)?

蔣寧:我認(rèn)為挑戰(zhàn)是很多的,主要講四個(gè)方面。

第一個(gè)挑戰(zhàn)是關(guān)鍵性任務(wù)和動(dòng)態(tài)適應(yīng)性。在動(dòng)態(tài)系統(tǒng)里,大模型驅(qū)動(dòng)下的人工智能還不具備100%精準(zhǔn)決策能力。金融行業(yè)的場(chǎng)景不是一成不變的,面對(duì)不可預(yù)期的外界環(huán)境和突發(fā)意外情況,大模型并不能做一如既往地給出穩(wěn)定舉措,這給金融機(jī)構(gòu)在人工智能的技術(shù)應(yīng)用提出了一個(gè)非常大的挑戰(zhàn)。

第二個(gè)挑戰(zhàn)是個(gè)性化要求和隱私保護(hù)之間的矛盾。金融行業(yè)一直希望通過(guò)人工智能來(lái)實(shí)現(xiàn)極致的用戶體驗(yàn),特別是個(gè)性化的體驗(yàn),但這需要個(gè)人隱私數(shù)據(jù)與大模型技術(shù)相融合,這樣帶來(lái)的隱私數(shù)據(jù)保護(hù)問(wèn)題目前還很難有一個(gè)解決方案。

第三個(gè)挑戰(zhàn)是群體智能與安全可控。大模型的訓(xùn)練機(jī)制決定其需要大量數(shù)據(jù)來(lái)構(gòu)建增強(qiáng)學(xué)習(xí)、強(qiáng)化學(xué)習(xí)的網(wǎng)絡(luò),讓多方共同打造一個(gè)平臺(tái),基于這一平臺(tái)持續(xù)貢獻(xiàn)數(shù)據(jù)與反饋,從而讓AI實(shí)現(xiàn)技能的進(jìn)化。但目前出于數(shù)據(jù)安全考量,行業(yè)內(nèi)跨組織、跨機(jī)構(gòu)的數(shù)據(jù)共享機(jī)制仍然需要持續(xù)性的探索。

第四個(gè)挑戰(zhàn)是對(duì)大數(shù)據(jù)和基礎(chǔ)設(shè)施的能力挑戰(zhàn)。未來(lái)摩爾時(shí)代大模型技術(shù)的應(yīng)用需要高速增長(zhǎng)的數(shù)據(jù)能力,對(duì)金融機(jī)構(gòu)網(wǎng)絡(luò)、服務(wù)器、芯片、底層架構(gòu)等等都提出了全新的要求,這也是未來(lái)需要突破的。

《21世紀(jì)》:為應(yīng)對(duì)這些挑戰(zhàn),你認(rèn)為有哪些技術(shù)將被廣泛運(yùn)用?

蔣寧:我看到三個(gè)關(guān)鍵技術(shù),概括來(lái)說(shuō)是持續(xù)學(xué)習(xí)、魯棒性決策以及組合式AI系統(tǒng)。

持續(xù)學(xué)習(xí),就像前面所說(shuō),它是大模型基于數(shù)據(jù)的反饋,讓系統(tǒng)越用越聰明。如何構(gòu)建一個(gè)增強(qiáng)的訪客系統(tǒng)讓更多人使用,這就是在線學(xué)習(xí)、持續(xù)學(xué)習(xí)、強(qiáng)化學(xué)習(xí)的技術(shù),這方面我們還有很多需要突破。

魯棒性決策,它是指即使面臨噪聲和突發(fā)情況干擾,大模型也可以作出一致性的可信回答,強(qiáng)調(diào)的是可信性。金融業(yè)和工業(yè)領(lǐng)域,0.1%的錯(cuò)誤都是不被允許的,合規(guī)、安全是最基礎(chǔ)、最核心的要求。無(wú)論在怎樣的動(dòng)態(tài)環(huán)境下,AI都需要排除噪聲干擾,為客戶做出合法合規(guī)的決策,這是魯棒性決策的要求。

組合式AI系統(tǒng),目前大家廣泛討論的AI是生成式大模型,而金融行業(yè)需要判別式大模型,必須直接給出正確或錯(cuò)誤的結(jié)果,二者之間必須有效結(jié)合才能發(fā)揮更大價(jià)值。從兩類模型的區(qū)別來(lái)看,判別式模型的訓(xùn)練成本很高,每個(gè)結(jié)果標(biāo)記對(duì)、錯(cuò),都是機(jī)器不斷學(xué)習(xí)的過(guò)程,但這個(gè)結(jié)果很難適應(yīng)變化中的場(chǎng)景,開(kāi)發(fā)成本很高。生成式大模型的訓(xùn)練則是需要全員的不斷參與,泛化能力非常強(qiáng),但它不能生成準(zhǔn)確的結(jié)果判斷。因此這兩種技術(shù)需要相互融合。

金融機(jī)構(gòu)如何試水大模型?

《21世紀(jì)》:從這些挑戰(zhàn)來(lái)看,是否意味著目前金融行業(yè)的大模型落地還很難?

蔣寧:這要結(jié)合大模型從人工智能的布局來(lái)看,分為四個(gè)大類的象限。第一個(gè)象限是基礎(chǔ)領(lǐng)域,包括生成式AI、判別式AI,這是基礎(chǔ)模型領(lǐng)域;第二個(gè)象限是在基礎(chǔ)領(lǐng)域上的垂直領(lǐng)域模型,像金融垂直領(lǐng)域的模型;第三個(gè)象限是在基礎(chǔ)領(lǐng)域和垂直領(lǐng)域模型的基礎(chǔ)上,創(chuàng)新生產(chǎn)力工具,比如,代碼自動(dòng)掃描,自動(dòng)生成語(yǔ)句,這是屬于工具類的;第四類是象限是應(yīng)用領(lǐng)域,比如,智能客服就屬于應(yīng)用領(lǐng)域,因?yàn)橹悄芸头豢赡馨汛竽P汀⒋怪鳖I(lǐng)域模型直接形成智能客服,所以需要第三象限內(nèi)智能審核工具等應(yīng)用。

目前金融行業(yè)在第一象限的基礎(chǔ)模型開(kāi)發(fā)還非常困難,我們?nèi)狈Τ掷m(xù)投入信息數(shù)據(jù)的反饋機(jī)制,但在第三第四象限的工具和應(yīng)用類別上,已經(jīng)可以實(shí)現(xiàn)大模型技術(shù)在部分金融業(yè)務(wù)場(chǎng)景下的應(yīng)用了。

《21世紀(jì)》:目前馬上消費(fèi)有嘗試大模型技術(shù)的應(yīng)用嗎?主要在哪些方面?

蔣寧:結(jié)合前面我們說(shuō)的挑戰(zhàn)和技術(shù)應(yīng)用路徑,我們提出了“三橫三豎”戰(zhàn)略。

其中,“三橫”包括:通過(guò)持續(xù)學(xué)習(xí)技術(shù)、模型控制、組合式 AI 系統(tǒng)形成的安全、合規(guī)、可信的魯棒性決策能力?!叭Q”包括:一是數(shù)據(jù)智能,二是多模態(tài)大模型,三是實(shí)時(shí)人機(jī)協(xié)作。

目前在應(yīng)用方面,我們開(kāi)發(fā)了智能生成報(bào)表的工具,在場(chǎng)景方面我們?cè)谥悄芸头弦呀?jīng)有所涉獵。

得益于消費(fèi)金融公司長(zhǎng)期與社會(huì)有廣泛交流,在中文高質(zhì)量數(shù)據(jù)集相對(duì)有限的情況下,我們公司歷史上累加了將近40PB的客戶聲音數(shù)據(jù),來(lái)幫助我們訓(xùn)練人機(jī)協(xié)作模型,訓(xùn)練人機(jī)對(duì)話的模型,并且利用大模型技術(shù)為人機(jī)對(duì)話提供更好的幫助。我們基于這樣近千億的數(shù)據(jù)量和組合模型,結(jié)合機(jī)器的反饋機(jī)制進(jìn)行強(qiáng)化學(xué)習(xí),在不同場(chǎng)景下,把語(yǔ)音、聲紋,包括心理學(xué)這些模型融合在一起,同時(shí)為了應(yīng)對(duì)機(jī)器在突發(fā)情況下的問(wèn)題,我們通過(guò)人機(jī)協(xié)作的形式實(shí)現(xiàn)魯棒性決策,這是我們科技方面的核心競(jìng)爭(zhēng)能力。