信網11月17日訊 大數據是最有潛力的“礦產資源”,那么如此有魅力的“礦產資源”如何助推金融業的發展?信網發現,在本次全球大數據論壇,眾大咖發表了自己的觀點,大數據不僅改變著金融業的交易模式,而且對控制風險、個性化定制、理性投資等方面讓金融機構、消費者都能體驗到新金融的顛覆魔力。
去中間商,交易時間縮短
知名大數據網站德塔弗洛克(Datafloq)創始人馬克·范·雷蒙南(Mark van Rijmenam)認為,首先,大數據技術在金融業方面的運用是有很多潛力可挖的。對消費者和金融業兩方面的數據進行分析,及時了解消費者的需求,從這個層面上來講,大數據技術的運用可以降低金融業的一些風險。而通過大數據技術,結合一些社交媒體或者其他渠道獲得的數據,可以對客戶進行更深的了解。再就是區塊鏈的支撐是近些年大數據技術給金融業帶來的最重要變化。以前銀行之間的金融、現金交易會花幾天的時間,現在這個時間被大大縮短,變成幾分鐘甚至幾秒鐘。
區塊鏈是指什么?他說,就是通過單一、真實的源頭,通過資源的分享,通過所有人都來分享一個統一的、單一的數據庫、數據源,但是因為不同的參與方參與進來了,它們就可以形成這樣一個鏈條式的連接。這就意味著當數據已經處于區塊鏈當中就已經進行加密了,就不可能進行改變了。就像比特幣的交易一樣,這實際上就改變了做生意的方式,因為它將中間商已經取消了,如果想在全世界去給那些不認識的人,或者不相信的人去做交易提供資金,需要用第三方,比如說是銀行,而通過區塊鏈,就已經不需要這個銀行的存在了,借款人可以在10分鐘之內把錢借給另一個人,完全不需要中間商了。而就在一兩周之前,第一個全球制造產品的交易,實際上這個是德克薩斯州的一船棉花運到了青島,就是用區塊鏈技術。
大數據助推,金融產品個性化定制
大數據應該說是落在行業里面速度最快的是在金融領域,在天云融創數據科技(北京)有限公司首席執行官雷濤看來,金融本身通過信息不對稱具備商業營運價值的,所以北美以及最近國內也有一個新的概念,就是科技金融,在這個過程里面,大數據落地在金融也是階段性的,第一個階段更多的是在信息基礎架構的實施上,也就是信息處理能力,因為中國的金融發展速度是非??斓?,隨便舉一個信用卡的公司,一個大型的股份制信用卡公司,覆蓋的人群數量上億張卡片規模,遠遠超過北美發達國家的數量,以傳統的體系架構之下很難支撐中國的發展速度,所以大數據的第一個個性就是分布式計算的基礎能力對金融核心體系的建設產生了根本性的變化,現在五大行和股份制銀行都已經啟動了金融基礎設施替換進程,像國內光大銀行也實現了第一個在線交易的全面柜員24小時在線的核心系統的替換,現在已經進入成熟商用了。
而第二個階段為人工智能的變化,以人工智能為驅動的開始出現了很多創新型的新業態,在投資領域基金券商領域的基金投募系統,像銀行領域也有個性化的服務,這些企業原來去銀行只有幾類用戶,私人銀行、金卡、白金卡用戶,只有幾類產品可以選擇,面向一大批人群,現在會定制個性化產品,基于風險預期、流動性、存量推薦多少股、多少債等進行定制,這是針對差異化,計算量首先是非常大的,沒有第一個階段的基礎設施是不可能完成的任務。第二,每一個人去算,不可能用大類的方法的經驗,一定是算法,就像淘寶一樣,買什么產品都有推薦引擎,每一個金融產品也有推薦引擎一樣有匹配原則。
大數據快速分析借款者還款能力
柯克·伯爾尼(Kirk Borne)是博思艾倫高級數據科學家、天體物理學家和空間科學家,是全球25位頂尖大數據科學家之一,他解析金融行業數據流,金融機構當中,有很重要的業務之一就是要去管理風險,他介紹,在交易以及各個領域、各個風險環境,都要很好地控制這樣一個風險,把數據信息能夠收集起來,能夠驅動我們的業務不斷地發展,能夠使得金融各個表現能夠更加的有益。
診斷型的分析就是可以幫助了解現在這個業務當中發生了什么事情,所以能夠幫助采取相適應的行動,而不僅僅只是去被動的接收。不管是機器學習模型還是傳統的模式,這都是一個學習的體系,能夠了解它的行為模式是怎么樣的,幫助更好地了解未來的發生情況。必須要很靈活的,非常靈敏地幫助很快的做出適應的調整。
有的時候,銀行對未來進行預測的時候,得到的結果不是很積極。那么對于一些非常有風險性的客戶,他們可能信譽不是很好,那么他們借款之后不一定能還款。那么有些信譽記錄非常良好的人,他們一旦借款,還款能力會很強、會很可靠。所以能夠基于他過去的一種信譽記錄,進行對未來還款行為的預測。
那么機器學習是一些數字、數學相關的算法。如果把這樣的一些數學的算法應用到機器上面,可能就跟人工智能相關了。同樣的,如果把這樣的一些機器學習的算術反映到數據上面,這叫做數據挖掘。這些都是強調必須從過去的經驗數據上進行總結。這個地方,我們在提及數據科學,它就是說把科學的方法能夠應用到各種不同的數據當中。包括一些自然的語言的過程,還有一些我們數據的語意信息,還包括視頻等等,它能夠去幫助我們去分析這樣一個場景當中到底有哪些含義。
機器學習它對于金融領域有什么方面的應用呢?金融機構跟其他的產業一樣,它可能會對用戶分享和推薦一種產品。于是它們就開始實驗一下,看看這個產品到底受不受歡迎,看看其他的人在買這些產品的時候,是不是也買這些產品,這就是一種科學過程,數據科學就是把這樣一種科學過程從數據中進行發現。
一張圖譜可摸清上市公司投資價值
知識圖譜這個詞在此次論壇上多次被提及,國防科技技術大學教授、上海數淘信息技術服務有限公司CTO湯大權介紹,知識圖譜的作用就是把人類的知識變成計算機可以能夠理解這樣的一些東西,讓計算機來按照知識圖譜所組織的人類的知識來處理一些具體的問題。
“其實對于知識圖譜來說,應該說隨著整個人工智能的發展,從最初人工智能應該說是從1956年達特矛斯會議到現在提出知識圖譜,已經有60年了,其實知識的表示一直在人工智能里面研究的一個很重要的領域,知識圖譜這個概念應該說谷歌最先提出來的,實際上在往前追溯應該是1956年達特矛斯會議開始,是作為人工智能的分支,就是知識表示的分支一直存在著。”湯大權說,在大數據的領域,隨著數據不斷的豐富,種類是越來越多的,怎么把這樣一些數據利用我們已有的知識組織起來,這可能就是知識圖譜在大數據里面的一些應用。
同時,在很多時候,每一個人可能有自己的一些不同的專業的領域的背景,一方面需要建立一個通用的知識圖譜,但是更重要的是,針對于不同的領域,需要有一些專業的圖譜。
對于金融領域,他舉了一個例子,湯大權介紹,比如一個上市公司如何描述它?它的一些相關的組織架構、信用,可以從互聯網、工商局的一些網站上得到一些信用,把這樣的一些東西組織成為一個圖譜,用來描述一個公司的實體。實際上,在很多的時候,分析一家公司是不是有很好的成長的價值的過程當中,就會用到這樣一些相關的知識,這可能就是在金融業里面的一些應用。
其實對于圖譜來說,我們把整個世界當做實體來看的,一個實體可能是一個人、一個公司、一個組織,對于整個這樣一個過程來說,對個人來說也是同樣的道理,只不過有一些數據可能是涉及到一些隱私等等一些方面的內容,這可能也會有一些安全方面的考量,比如說在支付寶上付了一些什么樣的賬,如果沒有授權,別人是不會拿到這些數據的。
對于通用的整個圖譜來說,現在一些大的公司都已經有一些相應的產品了,比如說谷歌、百度包括搜狗等,國內、國外的公司都有一些通用性的產品,比如微軟最近發布了一些它對知識圖譜管理的數據集。
“老百姓”這個詞,對于普通的搜索來說可能就是在座的大家,但是可能知道金融行業人來說,知道這是一家上市公司,但是在百度、谷歌上面敲“老百姓”,這些都會出來的,對于一個分析人員來說,如果要是不能夠識別出來這樣的東西,處理起來相當的困難,大數據帶來了數據量的增長,但是實際上也帶來了對需求者感興趣的命中率降低,希望通過這樣的技術,能夠為專業的金融分析人員提供非結構化情報的支持。
信網全媒體記者 杜杲燃
[編輯:光影]大家愛看