ABC(商業(yè)智能、大數(shù)據(jù)、云計算)等新技術(shù)的應(yīng)用正在加速金融與科技的融合。如今,金融科技正在成為傳統(tǒng)銀行業(yè)集體轉(zhuǎn)型的大勢所趨。百度的技術(shù)積累將如何幫助銀行業(yè)轉(zhuǎn)型?一起聽聽百度副總裁怎么說。
人工智能時代,打造智慧數(shù)字銀行已經(jīng)成為中國各大銀行轉(zhuǎn)型的方向,特別最近兩年隨著人工智能,大數(shù)據(jù)、云計算的發(fā)展,讓傳統(tǒng)銀行業(yè)產(chǎn)生了沉重的危機感。
銀行不能成為二十一世紀的恐龍,銀行必須走在金融科技發(fā)展的前列,成為業(yè)界共識。當前,中國經(jīng)濟進入新常態(tài),告別跑馬圈地、粗放式發(fā)展的中國銀行業(yè)更是將科技視為推動銀行業(yè)轉(zhuǎn)型的助推器,各主要銀行紛紛加大科技投入,希望通過擁抱新一輪技術(shù)革命,繼續(xù)保持領(lǐng)先優(yōu)勢。
但知易行難,雖然中國銀行業(yè)科技水平近年來得到飛速發(fā)展,智能化水平顯著提高,但是從全球范圍來看,銀行業(yè)并不是新技術(shù)的創(chuàng)新者,引導(dǎo)新一輪技術(shù)革命的企業(yè)并不是銀行業(yè),而是谷歌、百度等大型互聯(lián)網(wǎng)科技公司,銀行業(yè)一般是在其技術(shù)成熟時,通過技術(shù)引進,在金融業(yè)加以應(yīng)用。
如何能讓新科技革命盡快服務(wù)銀行業(yè),推動中國銀行業(yè)科技水平引領(lǐng)國際銀行業(yè)成為業(yè)界關(guān)注的焦點。
2017年12月,在銀行業(yè)科技年會上,百度公司副總裁、百度云總經(jīng)理尹世明告訴與會的中國銀行業(yè)科技部門主要負責人,傳統(tǒng)的技術(shù)架構(gòu)已經(jīng)跟不上智能時代的需求,銀行要開始準備打破數(shù)據(jù)圍墻,迎接ABC時代(AI人工智能、Big Data大數(shù)據(jù)、Cloud Computing云計算)的來臨。
百度公司副總裁、百度云總經(jīng)理尹世明
以下是演講內(nèi)容全文:
各位銀行界的專家以及同仁,非常高興今天來參加這個會議。去年的12月,當時百度內(nèi)部有個會議,這個會議在講云計算、人工智能、大數(shù)據(jù)到底會怎么發(fā)展?當時在想一個問題,就是有大量的企業(yè)其實是不愿意上云的。有人說是因為保守,也有人說是因為對于數(shù)據(jù)丟失的恐懼,還有可能是因為對數(shù)據(jù)的恐懼,對上云之后到底能帶來什么質(zhì)的變化,能帶來業(yè)務(wù)流程的新變革嗎?心存疑慮。也許能夠帶來一些服務(wù)器資源的節(jié)省,但即使節(jié)省一半,那其實也沒多少錢,所以很多人會說為什么要上云。但是在我們看來,云計算的核心是說它很有可能是一個新的時代,就是因為云的產(chǎn)生,所以才有了大量的數(shù)據(jù),因為有大量數(shù)據(jù)的產(chǎn)生才有了今天的人工智能,這三者是三位一體的。所以說從2016年11月份開始百度提出 ABC(AI人工智能、Big Data大數(shù)據(jù)、Cloud Computing云計算)三位一體,應(yīng)該是以這樣的一種方式去探討未來的技術(shù)架構(gòu),所以我們提出Cloud2.0 。
今天我們談這個問題的時候,先來看幾個案例,這是國家開發(fā)銀行的授信評審的連接數(shù)據(jù),大家可以看到很重要的一點就是引入了外部的數(shù)據(jù)。百度的爬蟲每天對全球的網(wǎng)頁進行抓取,某一個鋼鐵企業(yè)是不是發(fā)生了一些問題,或者這個鋼鐵企業(yè)可能在一個很偏遠的法院里面,已經(jīng)被人訴訟了,這是不是個風險信號?這是不是比財務(wù)報告更加直接的一個風險的預(yù)警?顯然是的。另外一點,開始有一個集中區(qū)域里面有人員在說某一家鋼鐵或者另外一個放貸企業(yè)的老總的身體狀況,或者有人說欠薪怎么辦,那是不是一個風險的預(yù)警?這是非常顯性的風險的預(yù)警,但這些靠傳統(tǒng)的企業(yè)內(nèi)部的數(shù)據(jù)是無法獲取的。這個案例就是大數(shù)據(jù)的應(yīng)用。
什么叫大數(shù)據(jù)?如果我們定義大數(shù)據(jù)是企業(yè)內(nèi)部的數(shù)據(jù),它就不叫大數(shù)據(jù)。今天企業(yè)內(nèi)部的數(shù)據(jù)量其實是很有限的,百度每天處理的數(shù)據(jù)量在100PB量級,這還是去年年初的一個數(shù)據(jù)。今年視頻一來之后,這個數(shù)據(jù)可能要成倍增長。那么大數(shù)據(jù)的核心是什么,大數(shù)據(jù)的核心在我們看來有可能是要開始突破企業(yè)的圍墻,不能夠再以一個企業(yè)作為數(shù)據(jù)來源維度,應(yīng)該是要放寬視野,在更大的范疇里面去尋找數(shù)據(jù)的來源,所以要突破企業(yè)的邊界。
那么這里面,我在講這個架構(gòu)的過程里面,我首先講兩個案例,一個案例是我們跟某一個銀行合作,在傳統(tǒng)的信用卡申請時,你擔心申請人不合規(guī),不合法,之前的算法是基于規(guī)則引擎,大量的程序設(shè)計員或者算法設(shè)計員設(shè)計一個規(guī)則,由這個規(guī)則定義申請人是不是合規(guī)、合法,所以這些人的思想和想法,就限定了這個規(guī)則本身只能達到這個水平。但是,人工智能改變了這個游戲規(guī)則,怎么改變呢?可能是基于一個深度學習的平臺,比如Google的Tensor Flow,百度的PaddlePaddle,以這個進行訓(xùn)練,然后產(chǎn)生一個能夠科學評估并不斷根據(jù)新數(shù)據(jù)來進行自我修正的模型,我們跟這個銀行合作,作為一個試驗性的項目,其實訓(xùn)練只花了一個禮拜的時間,模型的成功概率就達到了90%以上。以往最高也只能達到80%。人工智能基于對數(shù)據(jù)的學習和訓(xùn)練,可以幫助你找到基于無窮變量的一個規(guī)則,而以前所有計算的規(guī)則是基于一個有限變量的規(guī)則,這是不一樣的。
再講一個實際的案例,我們跟首鋼(北京首鋼自動化信息技術(shù)有限公司)合作了一個基于計算機視覺的質(zhì)量檢查,來提高首鋼在品控方面的效率和精度。以前是要通過一個非常昂貴的做法才能去辨別的。首鋼給了我們20萬張質(zhì)檢車間的鋼材圖片,我們在四天之內(nèi)完成了圖片所有特征的標注,在標注之前,在數(shù)據(jù)產(chǎn)生價值之前是純?nèi)斯さ闹悄埽阋斯と俗⑺粯俗⑼炅酥螅瑢@些數(shù)據(jù)進行了學習訓(xùn)練,最終這個模型對瑕疵鋼材的識別準確率是99.8%。以前的我們會預(yù)定一些規(guī)則,我喜歡把它叫做pre-define,然后以預(yù)定的規(guī)則去指導(dǎo)我們的業(yè)務(wù),但今天可能會發(fā)生變化,這個pre-define像pre-train,就是預(yù)訓(xùn)練的規(guī)則。這個預(yù)訓(xùn)練的規(guī)則你是不知道其所以然的,你只知道它確實管用,而且你只需要了解它管用就可以了,里面到底什么原因?不知道,也不需要知道。那么意味著什么?意味著我們要改變一種方法,這種方法就是我們的規(guī)則沒有必要靠人為去制定,而規(guī)則是要靠學習出來,靠訓(xùn)練出來的,這是第二個重大的變化。
那么第三個變化,百信銀行今年二月底的時候我們開始為他做一個系統(tǒng),我記得當時提的一些要求還是覺得蠻挑戰(zhàn)的。第一就是它一定要堅決地去掉Oracle,全部基于分布式架構(gòu)搭建一套基于X86的架構(gòu),后來我們實現(xiàn)了,底層架構(gòu)是完全基于分布式X86的架構(gòu),計算能力是完全可以靈活擴展的。另外一點,它基于X86和那個分布式系統(tǒng)之后,它的成本也就變得非常低。我們在上線的時候做到的TPS是4800,但其實對于我們來講,如果它要乘以10倍,做到五萬,對我們來說技術(shù)上完全沒問題。如果要更多的我們也可以探討,因為這個其實計算的算力以及算的方法已經(jīng)完全不一樣了。
服務(wù)的連續(xù)性和可靠性,我們正在努力,希望使RTO和RPO兩者都接近于零。但是現(xiàn)在可能還不能完全做到,計算這個領(lǐng)域也發(fā)生了變化,可以看到它整個的架構(gòu)搭建,底層是計算虛擬化了,存儲虛擬化了,網(wǎng)絡(luò)也虛擬化了,也完全符合監(jiān)管的要求。而且一個海量的數(shù)據(jù)分析平臺可以完成各種各樣大數(shù)據(jù)的處理。
第三個方面是什么?目前對于算力的理解和計算的理解應(yīng)該是不一樣的,算力如果乘以10倍之后還是用老方法做原來的事情,好像是有點兒不太對,對嗎?因為你已經(jīng)有了本質(zhì)的提升,但你卻還是用老的方法在做所有的事情。剛才其實我通過三個案例,一個是講了B,也就是Big Data領(lǐng)域的一些內(nèi)容,一些變化;一個案例講了AI,就是通過數(shù)據(jù)形成智能;講了C,Cloud Computing的案例,三個領(lǐng)域的三個案例。所以三大特征,第一個是數(shù)據(jù),我覺得一定是要打破數(shù)據(jù)的圍墻。對于銀行業(yè)有各種各樣的監(jiān)管的要求,這一塊還是需要探討的,但是外面的數(shù)據(jù)實在是洶涌澎湃的,怎么去利用它?以傳統(tǒng)的架構(gòu)利用它,還是用新的架構(gòu)利用它?我覺得這是個問題。第二個,算法的規(guī)則已經(jīng)發(fā)生變化,我們的規(guī)則應(yīng)該既要涵蓋預(yù)定義的規(guī)則,也要涵蓋預(yù)訓(xùn)練的規(guī)則,而預(yù)訓(xùn)練的規(guī)則將可以打開一扇完全不同的窗。第三個,就是算力的邊界,所以ABC三者三位一體能有一些新的變化。但是剛才我講到所有的案例,從百度來看根本的變化在哪里?看到有C的變化,有B的變化,有A的變化,因為計算能力的提升產(chǎn)生了大數(shù)據(jù),因為大數(shù)據(jù)的提升產(chǎn)生了一個人工智能新的一個時代,更核心的在哪里?1992年之前是大機的時代,大機的時代是非常封閉的,1992年之后可以發(fā)現(xiàn)整個IT行業(yè)迎來一股春風,也就是Client Server,客戶服務(wù)器架構(gòu),而客戶服務(wù)器架構(gòu)開始在硬件軟件和服務(wù)這塊進行解耦,你會發(fā)現(xiàn)硬件方面有IBM,也有Unix服務(wù)器,也有Dell。軟件方面你會發(fā)現(xiàn)ERP方面有SAP、有Oracle,數(shù)據(jù)庫方面有SyBase、Oracle和MySql。服務(wù)方面,你會發(fā)現(xiàn)有了埃森哲這種企業(yè)。
Client Server造就了一個時代,這個時代持續(xù)到了2011年,在我個人看來,但隨后突然發(fā)現(xiàn)這個時代受到了巨大的挑戰(zhàn),最佳業(yè)務(wù)實踐好像已經(jīng)不再可以成為最佳了,咨詢公司的建議好像已經(jīng)不再可以滿足快速發(fā)展的需求了,為什么?因為世界發(fā)生變化了。大機時代和客戶服務(wù)器時代是是企業(yè)級的時代,企業(yè)級還可以在里面說,我把企業(yè)這一環(huán)節(jié)統(tǒng)一起來之后,把企業(yè)的數(shù)據(jù)統(tǒng)一起來之后,可以產(chǎn)生巨大的紅利。但是今天突然發(fā)現(xiàn)一個分布式的時代來臨了,一個區(qū)域中心化時代來臨了,這個時候你突然發(fā)現(xiàn),企業(yè)就是自建的圍墻,如果你在圍墻之內(nèi)去運行的時候,你有很大的阻力,你的思維打不開,為什么?你是企業(yè)級的,企業(yè)級就是很大的問題。傳統(tǒng)的挖潛,已經(jīng)達到一個相對極致的地方了。傳統(tǒng)的企業(yè)流程再造已經(jīng)不足以去完成企業(yè)更大程度的優(yōu)化了,這個時候要向外挖潛、向外整合,但是傳統(tǒng)的架構(gòu)限制了我們的數(shù)據(jù)只能是企業(yè)級的,我們的流程只能是企業(yè)級的,我們的做法只能是企業(yè)級的,但是我們堅信ABC的時代來臨了。ABC的時代,計算這個環(huán)節(jié)是cloud,基于cloud的核心不在于是說做了幾個計算詞節(jié)省了一點,cloud的核心是說計算的資源可以沒有邊界。我可以在一個很大的一個范疇之內(nèi),完全計算。計算首先沒有邊界,而計算沒有邊界之后,隨后帶來一點,數(shù)據(jù)逐漸的就開始沒有邊界了,數(shù)據(jù)已經(jīng)開始在各個領(lǐng)域里面流動,雖然不是一個有序的流動,但是已經(jīng)是有大量的數(shù)據(jù)在外面流動,而這些數(shù)據(jù)并沒有被很好的利用起來,也沒有很好的規(guī)范把它做起來。有了這些數(shù)據(jù)之后,就會產(chǎn)生新的意思,就是AI,新的意思意味著新的業(yè)務(wù)流程。
同樣的一個人,如果他詐騙了一個地方,為什么其他的所有銀行沒有反應(yīng)?因為這數(shù)據(jù)沒有觸發(fā)所有的信號,因為我們原來所有設(shè)計的軟件就是企業(yè)級的,所以我堅信一點,ABC(AI人工智能、Big Data大數(shù)據(jù)、云計算Cloud Computing)或者新的架構(gòu)可能會開啟下一個20年,除了云計算之外隨后一定會帶來軟件這個層面設(shè)計的變化,隨后形成新的意識和新的做法。這是我們認為說它背后的邏輯在里面,正是因為背后的邏輯,那以后的銀行應(yīng)該怎么搞?我們也不知道,我們只是說我們應(yīng)該是那個ABC(AI人工智能、Big Data大數(shù)據(jù)、云計算Cloud Computing)組合起來的。那么A這一塊,就是說你要能兼容傳統(tǒng)的技術(shù)架構(gòu),基于CPU的計算,你要能基于創(chuàng)新的技術(shù)架構(gòu),什么叫創(chuàng)新的技術(shù)架構(gòu)?假如說你是分步式的計算架構(gòu),你基于深度學習你應(yīng)該怎么做。今天有很多企業(yè)可能會發(fā)現(xiàn),你的機房可能就放不了GPU的服務(wù)器,因為功率不夠。那是很悲催的一件事情,也就是說你沒有辦法去嘗試所有的新一代的基于深度學習的這樣的一個框架。那進入到安全也是不一樣的,在大數(shù)據(jù)這個層面應(yīng)該是基于大數(shù)據(jù)的風控。你可以有大量的數(shù)據(jù)可以用,還有可以去進行智慧網(wǎng)點布置,可以進行大數(shù)據(jù)營銷。其實現(xiàn)在的一些營銷的技術(shù)像百度因為做廣告出身的,剛才也說了像Google一樣在這個精準營銷用戶畫像、企業(yè)畫像方面積累了大量的經(jīng)驗。隨后智能的金融,簡單一點像呼叫中心的這個創(chuàng)作,像新的業(yè)務(wù)的一個創(chuàng)新。這一塊其實在座的各位你們是專家,我們只是一個技術(shù)的提供方,我們深信這一點有可能帶來新的一種架構(gòu),然后支撐的業(yè)務(wù)在這里不再細講了。
這是我們相信的地方,我們在跟一些金融機構(gòu)在合作的過程中也發(fā)現(xiàn)一個問題,就是說這個時候確實數(shù)據(jù)要開始突破企業(yè)的邊界了,但是監(jiān)管方面到底應(yīng)該怎么做能夠達到監(jiān)管的要求,或者監(jiān)管方面我們應(yīng)該做一些不一樣的新的規(guī)定來確保安全性、保密性和穩(wěn)定性,同時又能享受到這種開放的紅利。這一點其實百度不是專家,在座的各位是專家,我們只是說技術(shù)的趨勢已經(jīng)洶涌而至,但是我們也希望得到在座各位的一些建議和引導(dǎo),將來如果可以在技術(shù)上進行探討也非常好。百度方面也做了一些探討,這也是百信銀行的東西,利用機器學習規(guī)則實現(xiàn)在線的阻斷和離線的審計分析這樣一件事情。基于Giano(百度分布式安全系統(tǒng))的統(tǒng)一身份管理,等等。
我相信這只是非常非常抽象的一個拋磚引玉,就是說,如果說數(shù)據(jù)開放已經(jīng)成為一個洶涌澎湃的趨勢,是不是應(yīng)該有一個機構(gòu)去構(gòu)建一個共享的數(shù)據(jù)平臺。你那個數(shù)據(jù)平臺真得不是任何一家可以構(gòu)建的,然后使它比較安全的運行出來,這是第一個想法。第二點就是說,如果你的銀行、你的基礎(chǔ)架構(gòu),完全還是基于企業(yè)結(jié)構(gòu),我剛才說的企業(yè)級的核心說你才是基于企業(yè)級的,其實你就很難享受到一種新時代的技術(shù)的紅利,所以這一塊也是說基于全新的云服務(wù)架構(gòu),有沒有一種可能性建成一套,就是說既能夠滿足監(jiān)管,又能夠?qū)崿F(xiàn)對這種新技術(shù)的紅利的分享的一種新的云服務(wù)的一種模式?如果這也是能有一些碰撞的話,我覺得其實中國的銀行業(yè)可能發(fā)展會遠超國外,現(xiàn)在其實已經(jīng)超過國外了,會大幅度的加快,這是我們希望探索的一點。
那可以看見的未來之路在哪里?我簡單舉一個例子。就說我剛剛講了ABC(AI人工智能、Big Data大數(shù)據(jù)、云計算Cloud Computing)三位一體,我們2016年11月提的ABC三位一體這樣一個概念,在2017年大概是九月份,我們提出了ABC的技術(shù)棧,就是如何施行一個完整的ABC技術(shù)棧。AI方面剛剛談到了人臉識別、語音識別、文字識別、圖像識別,深度學習的平臺、機器學習的平臺、自然語言的處理,那么這些東西都是很基礎(chǔ)性的工作。那百度我覺得還是比較自豪的,在AI方面我們基本上是有最全面的AI技術(shù)。
在大數(shù)據(jù)平臺也是一樣,如何實現(xiàn)一些基礎(chǔ)數(shù)據(jù),包括像用戶畫像,還有其他的一些輿情的監(jiān)控。云計算平臺就剛剛講的異構(gòu)計算和同構(gòu)計算,我其實也跟一些銀行溝通過一些云計算的可能性,我相信一點,銀行業(yè)可能真的是要開始思考異構(gòu)計算這個方向了,有些企業(yè)已經(jīng)在開始思考異構(gòu)計算一定會帶來全新的可能性,基于GPU和FPGA這種計算,或者ASIC FPGA這樣一些東西。這一塊其實你要動起來的時候你發(fā)現(xiàn)其實有很多事情要做,你的機房要改造,系統(tǒng)架構(gòu)要改定,但是非常值得去探索。基于ABC(AI人工智能、Big Data大數(shù)據(jù)、云計算Cloud Computing),再去做一個全新的業(yè)務(wù)應(yīng)用,這個業(yè)務(wù)應(yīng)用可以讓你有更大的一個范疇去思考業(yè)務(wù)流程,這是不太一樣的。
異構(gòu)計算這個領(lǐng)域,我剛才談了很多,這是一個基礎(chǔ),我們異構(gòu)計算,一定要談GPU FBGA。舉例像我們自己做異構(gòu)計算,我們現(xiàn)在也可以在一個單幅,百度的機房里面已經(jīng)沒有商用服務(wù)器,我們的服務(wù)器全是自研的。包括GPU這一塊,你看我們的服務(wù)器是單一的一個服務(wù)器可以做到64片卡,單集群可以并發(fā)調(diào)度的服務(wù)器已經(jīng)有一千臺了,單集群并發(fā)調(diào)度的GPU卡數(shù)可以達到5000片,單集群的用戶數(shù)據(jù)達到1萬,單集群并發(fā)調(diào)度的作業(yè)水平可以達到10萬,這對一般性的銀行來說已經(jīng)是夠用了。所以當你去進入異構(gòu)計算,進入這個人工智能時代的一個深度學習,平臺的搭建,那我上面還有一些不太一樣,跟傳統(tǒng)的重構(gòu)計算不太一樣的控制臺,分布式存儲,這是不一樣。當然你可以做出你個人各種各樣的其他一些專用的一些一體機也是可以做。
異構(gòu)計算是個趨勢,數(shù)據(jù)也是個趨勢。數(shù)據(jù)一定要產(chǎn)生意識,它才有價值。我們這段時間跟工業(yè)領(lǐng)域的一些企業(yè)也有很多接觸,有很多工業(yè)企業(yè)積累了大量的數(shù)據(jù),但這些數(shù)據(jù)基本就是沉睡在那里,產(chǎn)生不了意識,這種沒用的。所以一定要把數(shù)據(jù)用起來,輸出模型的能力做起來。我剛才講的那個第二個案例的時候我們跟某家銀行也做了這個合作,他只是把他用了信用卡的一些數(shù)據(jù)給了我們,那是一個禮拜的訓(xùn)練周期就得出這個模型,這就是把數(shù)據(jù)真正的用起來。企業(yè)自身的數(shù)據(jù)價值可能超越很多人的想象。另外一點,像一些精準營銷的平臺,這個也是一樣的結(jié)合外部的數(shù)據(jù)。還有像通過廣告投放,還有企業(yè)數(shù)據(jù)接口,所有這些東西,大數(shù)據(jù)這個領(lǐng)域最核心的一點需要你真的是能夠有大數(shù)據(jù)處理的一種能力和一種可能性。