超AI說|從大海撈針到按圖索驥,厘清復(fù)雜的銀行風(fēng)控場景
2021-10-14
小明:
金融是一個(gè)高風(fēng)險(xiǎn)的行業(yè)。而且由于它在國民經(jīng)濟(jì)當(dāng)中的重要地位,單個(gè)金融機(jī)構(gòu)的風(fēng)險(xiǎn)可能引發(fā)多米諾骨牌效應(yīng),牽一發(fā)動(dòng)全身?,F(xiàn)在的金融機(jī)構(gòu),比如老百姓接觸最多的銀行,是怎么防范風(fēng)險(xiǎn)的?
鄒明:
簡單點(diǎn)兒說,銀行是吸收存款、釋放貸款產(chǎn)生利差,這個(gè)是銀行收入的一個(gè)主要的來源。在這個(gè)過程當(dāng)中就會產(chǎn)生風(fēng)險(xiǎn):如果這筆貸款回不來,風(fēng)險(xiǎn)如果不能被有效管控,貸款產(chǎn)生損失的話,那自然大家的存款就會受到損失。這是一連串的資金鏈。
銀行的風(fēng)險(xiǎn)主要指銀行在吸儲和投資的過程當(dāng)中,怎么保證資金的安全性問題。通常我們說,在銀行風(fēng)險(xiǎn)管理里邊有三道防線,簡單點(diǎn)說就是事前、事中和事后,會有整套的風(fēng)險(xiǎn)稽核的業(yè)務(wù)手段來保障整體的風(fēng)險(xiǎn)是可以預(yù)見的、可以防范的,當(dāng)風(fēng)險(xiǎn)發(fā)生之后,我們也會有相應(yīng)的手段去應(yīng)對的。
比如說我是一個(gè)企業(yè)主,我想為我的公司的經(jīng)營申請貸款。對于銀行的客戶經(jīng)理來講,他需要對這個(gè)客戶進(jìn)行相應(yīng)的評級工作。所謂評級就是衡量這個(gè)客戶的信用等級是高、中還是低,從而來決定我們要不要和這個(gè)客戶簽約。這是在事前的階段。
事中的階段是說,我們要去衡量當(dāng)這筆貸款發(fā)放出去之后,他的業(yè)務(wù)狀況是否能夠保證有足夠的還款能力。銀行的員工需要查看這個(gè)客戶的相關(guān)信息,比如說他的廠房、員工、實(shí)際的生產(chǎn)資料購買和使用的狀況,以及最終商品售賣的情況。如果這個(gè)企業(yè)本身就是一個(gè)入不敷出的經(jīng)營狀態(tài)的話,銀行是不可能給他貸款的。
事后我們要不斷去了解這家企業(yè)的經(jīng)營狀況,它是不是持續(xù)有比較健康的現(xiàn)金流?他的業(yè)務(wù)開展是不是順暢?特別是銀行給他放出的貸款是不是用在他原本去申請這筆貸款的目的上。整個(gè)流程我們要看服務(wù)對象本身的情況、經(jīng)營的要素、對于合同的執(zhí)行的狀況是否符合他和銀行簽約的條款和內(nèi)容約束。這是整個(gè)對于這筆業(yè)務(wù)的風(fēng)險(xiǎn)保障的一個(gè)流程。
傳統(tǒng)的風(fēng)控手段其實(shí)需要大量的人工介入,出于兩個(gè)原因。一方面,過去我們在大數(shù)據(jù)時(shí)代之前,業(yè)務(wù)人員沒有足夠的信息來支撐他做出足夠的判斷。另一方面,從信息化、數(shù)字化的層面,沒有比較好的技術(shù)手段將這些數(shù)據(jù)變成能給他足夠洞察的結(jié)果。
小明:
俗話說“道高一尺,魔高一丈”,盡管金融機(jī)構(gòu)在科技化領(lǐng)域走在了前沿,但仍然避免不了有心人鉆空子,比如媒體廣泛報(bào)道的“羊毛黨”。對于越來越科技化、隱蔽化的黑灰產(chǎn)、欺詐行為,銀行如何應(yīng)對?
鄒明:
對于金融詐騙或者金融犯罪的這些行為,其實(shí)銀行一直在行動(dòng)。
還是先前說的三道防線,每一道防線都會不斷地監(jiān)控可能發(fā)生的外部風(fēng)險(xiǎn)事件、內(nèi)部存在的風(fēng)險(xiǎn)合約等等。薅羊毛這個(gè)事有很多方面,它是屬于反欺詐的分類。
對于欺詐行為的識別:什么樣的人,在什么樣的時(shí)間,通過什么樣的渠道,和銀行產(chǎn)生了一次什么樣的交互。這些特征綜合在一起,是否構(gòu)成一個(gè)欺詐的行為,在銀行內(nèi)部有一個(gè)不斷升級的反欺詐的特征識別庫。這個(gè)庫會用到我們的數(shù)據(jù)中臺、知識圖譜等技術(shù)。到下次再有類似的特征發(fā)生的時(shí)候,很快就會關(guān)聯(lián)到這個(gè)特征庫,再去做相應(yīng)判斷。
第二個(gè)點(diǎn)通常叫“欺詐團(tuán)伙發(fā)掘”。欺詐這種行為,特別是薅羊毛這種行為,往往不是一個(gè)人在戰(zhàn)斗,背后通常有一個(gè)利益群體。我們會綜合一些例如資金交易往來等的數(shù)據(jù),將一些經(jīng)常有交易往來的客戶識別出來。在這個(gè)基礎(chǔ)之上,我們可以構(gòu)建出一個(gè)疑似欺詐團(tuán)伙的圖譜。把這些團(tuán)伙找出來之后,再結(jié)合相關(guān)的特征,不僅可以防止他們?nèi)ギa(chǎn)生一些欺詐、薅羊毛等行為,還可以把這些團(tuán)伙的知識固化在我們的知識庫當(dāng)中,未來不斷升級,防止更多類似的或者跟他有關(guān)聯(lián)的欺詐行為。
小明:
您剛才提到,銀行業(yè)務(wù)人員每天面對大量業(yè)務(wù)和復(fù)雜的流程,想必工作是千頭萬緒。企業(yè)的數(shù)字化怎么能幫助他們理清頭緒呢?
鄒明:
我理解這個(gè)問題,應(yīng)該是分成三個(gè)步驟:數(shù)據(jù)的收集整理,數(shù)據(jù)的組織和關(guān)聯(lián),數(shù)據(jù)的應(yīng)用。
銀行會有很多的數(shù)據(jù),不一定都來自于業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫,也就是說它需要處理很多結(jié)構(gòu)化數(shù)據(jù),還要處理很多非結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)可能甚至包括一些紙質(zhì)的文檔等等。金融機(jī)構(gòu)經(jīng)過這么些年的信息化建設(shè),過去這些系統(tǒng)是我有個(gè)新的需求,就去建一個(gè)系統(tǒng)。豎井化的銀行IT架構(gòu),自然就造成了數(shù)據(jù)的相互割裂。
所以就產(chǎn)生了數(shù)據(jù)倉庫這樣的一個(gè)概念,把割裂的業(yè)務(wù)系統(tǒng)里的數(shù)據(jù)都匯總到一個(gè)統(tǒng)一的倉庫里,統(tǒng)一組織、統(tǒng)一使用。這是過去在這方面的一個(gè)嘗試。但是到了大數(shù)據(jù)時(shí)代,特別是還要解決非結(jié)構(gòu)化數(shù)據(jù)如何結(jié)構(gòu)化這樣的問題,信息量其實(shí)產(chǎn)生了指數(shù)級的增長,傳統(tǒng)的數(shù)據(jù)倉庫也無法支撐大數(shù)據(jù)時(shí)代的數(shù)據(jù)規(guī)模。
我們要解決的問題是,從海量的多源異構(gòu)的數(shù)據(jù)里找出有用的信息。明略科技的NLP技術(shù),可以解決非結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化的一個(gè)問題;數(shù)據(jù)中臺,比較好地解決了豎井化的各個(gè)業(yè)務(wù)系統(tǒng)當(dāng)中,數(shù)據(jù)如何收集和歸并的問題;當(dāng)這些數(shù)據(jù)歸并到一個(gè)數(shù)據(jù)中臺之后,知識圖譜可以在這些數(shù)據(jù)之間構(gòu)建它們的關(guān)聯(lián)關(guān)系,使得這些數(shù)據(jù)形成一張大網(wǎng),彼此關(guān)聯(lián)起來。有了這樣一個(gè)知識圖譜之后,我們就有能力構(gòu)建相應(yīng)的行業(yè)模型,能夠產(chǎn)生業(yè)務(wù)價(jià)值的大數(shù)據(jù)智能型的產(chǎn)品。
小明:
接下來這個(gè)問題我想不光金融機(jī)構(gòu),很多其他企業(yè)可能也遇到過:企業(yè)采購了或搭建了數(shù)字化系統(tǒng),但是業(yè)務(wù)部門并不愛用,或者并不會用,它就變成了技術(shù)部門自嗨的狀況。為什么會出現(xiàn)這種尷尬的局面?
鄒明:
這個(gè)問題非常好。第一,傳統(tǒng)信息化系統(tǒng)是有專業(yè)程度的,它是為銀行內(nèi)部一些專業(yè)的業(yè)務(wù)過程服務(wù)的?;谶@樣的一個(gè)出發(fā)點(diǎn),它并不是對于所有人來說都能獲得很好的使用體驗(yàn)。第二,我們過去的數(shù)字化系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn),往往都會存在一個(gè)問題:對于技術(shù)人員來說比較友好,但是對于業(yè)務(wù)人員的友好度不夠。
正是存在這樣的問題,使得很多的IT系統(tǒng)使用曲線是非常陡峭的。在我們意識到這些傳統(tǒng)系統(tǒng)的問題之后,特意對這個(gè)系統(tǒng)的使用體驗(yàn)去做了一個(gè)重新的設(shè)計(jì)。我們會從關(guān)注用戶日常業(yè)務(wù)場景化的角度去重新規(guī)劃整個(gè)系統(tǒng)。傳統(tǒng)數(shù)字化系統(tǒng)往往是一些具體功能的羅列,我們的產(chǎn)品提供了一種向?qū)偷氖褂皿w驗(yàn)。我們希望直接給客戶推送他需要使用的功能,而不是讓客戶在系統(tǒng)當(dāng)中去找,從流程上給他提供一個(gè)比較平滑的體驗(yàn)過程,不會讓他產(chǎn)生脫節(jié)感。
舉一個(gè)例子,對于風(fēng)險(xiǎn)預(yù)警這樣的一個(gè)話題,過去銀行的業(yè)務(wù)人員需要主動(dòng)分析數(shù)據(jù),包括報(bào)表的形式等,從這些數(shù)據(jù)當(dāng)中找到一些疑似的風(fēng)險(xiǎn)點(diǎn),基于這些風(fēng)險(xiǎn)點(diǎn)做相應(yīng)的預(yù)警的處理。向?qū)降墓δ苣軌蛑鸩揭龑?dǎo)客戶去完成業(yè)務(wù)的處理,對于風(fēng)險(xiǎn)預(yù)警,更加自動(dòng)化地、更加智能地將這些風(fēng)險(xiǎn)擺在業(yè)務(wù)人員面前。
比方說中美的貿(mào)易戰(zhàn)對出口的行業(yè)可能會產(chǎn)生一些什么樣的影響?在我們系統(tǒng)當(dāng)中都會有相應(yīng)的模型和算法,每天接收來自于外部的海量數(shù)據(jù),由這些模型算法自動(dòng)做出相應(yīng)的分析,分析之后形成相應(yīng)的洞察,為銀行的客戶經(jīng)理提供相應(yīng)的風(fēng)險(xiǎn)通報(bào),以及可能金融機(jī)構(gòu)應(yīng)該采取什么樣的措施,由他們來參考如何對這些風(fēng)險(xiǎn),進(jìn)行預(yù)警。
進(jìn)一步,我們會在某一些業(yè)務(wù)領(lǐng)域、某一些業(yè)務(wù)專題上提供專門的分析的工具。比如說票據(jù)業(yè)務(wù)流程當(dāng)中會牽涉到很多的實(shí)體,有相關(guān)的關(guān)聯(lián)方、客戶、資金,包括銀行自身也是業(yè)務(wù)參與者。過去,在處理相關(guān)業(yè)務(wù)時(shí)候,實(shí)際上沒有一個(gè)工具來集中看整個(gè)銀行所有的票據(jù),往往都是發(fā)生在某一筆具體的業(yè)務(wù)當(dāng)中,或者是從客戶的角度關(guān)聯(lián)到這筆業(yè)務(wù)可能有問題。我們有專門針對于客戶生命周期的分析、針對于資金流水的分析、金融票據(jù)的分析,能通過這些專題,有針對性地解決我們的客戶所面臨一些單點(diǎn)的問題。
小明:
我們常說機(jī)器學(xué)習(xí)是一個(gè)“黑盒子”,計(jì)算機(jī)給出結(jié)果,但是它如何算出來,我們是不知道的。但是對于金融以及醫(yī)藥、法律等其他很多領(lǐng)域來說,知其所以然非常重要。我們能夠通過什么樣的方法打開黑盒子呢?
鄒明:
金融機(jī)構(gòu),特別是銀行,是存在一些特殊性的。無論是從數(shù)據(jù),還是我們基于數(shù)據(jù)產(chǎn)生洞察的結(jié)果,務(wù)必精確。所以對于金融機(jī)構(gòu)來講,模型的可解釋性是非常重要的。當(dāng)下流行的這些機(jī)器學(xué)習(xí)手段以及一些產(chǎn)出,都存在一個(gè)可解釋性的問題??山忉屝圆桓叩脑?,一方面是我們對于銀行數(shù)據(jù)的了解程度不夠,再有一個(gè)原因是我們產(chǎn)出的模型其實(shí)并沒有吃透銀行相關(guān)的業(yè)務(wù)。這兩點(diǎn)也是我們一直在努力的,希望對業(yè)務(wù)場景的深刻理解,能夠幫助我們?nèi)?gòu)建更加精確的數(shù)據(jù)加算法。
信息填寫