本書面向金融應用,系統(tǒng)地闡述了大數據金融與征信本身及其在現實生活中的應用,具有全面性、實用性和前瞻性等特色。全書共8章,第1章和第2章闡述大數據金融及大數據技術相關的基礎知識問題,是后面章節(jié)的基礎。第3章至第6章詳細介紹大數據在銀行業(yè)、證券業(yè)、保險業(yè)及互聯網金融行業(yè)中的應用,是本書的主要內容。第7章重點闡述大數據在征信中的實際應用,是本書的另一重點問題,也是當代大數據研究的熱點問題。第8章特別強調中國金融信息安全,這是大數據金融與征信的發(fā)展進程中不可避免的問題。本書力爭把大數據與其實際應用糅合在一起介紹,力求活學活用。
本書可以作為高等學校互聯網金融院系課程教材,也可供互聯網金融研究者、從業(yè)者、管理人員參考所用。
本書主要有以下幾個特點:
內容全面。
全書以大數據為出發(fā)點,結合國內外的發(fā)展現狀及新模式,系統(tǒng)地介紹了大數據在銀行業(yè)、證券業(yè)、保險業(yè)、互聯網金融行業(yè)及征信中的應用,并強調了在應用過程中,中國金融信息安全的重要性及保障機制。本書內容涵蓋面極廣,有效地為各行各業(yè)的讀者提供了大數據金融與征信的宏觀視圖。
體例新穎。
本書秉承著注重實際運用的宗旨,編寫體例上彰顯了可讀性和互動性。每章前有“本章目標”和“本章簡介”,每章末有“本章總結”和“課后作業(yè)”。書中除了理論教學,還配有相關案例和解析,突出理論與實踐相結合,打破了傳統(tǒng)“羅列發(fā)條”的教材編寫模式,通俗易懂,開拓了學生的視野,更好地滿足了培養(yǎng)既懂專業(yè)知識又能運用所學知識解決實際問題的“復合型”經濟人才的需求。
大數據金融是大數據在金融領域的重要應用。大數據金融市場前景廣闊,預計未來5年到10年,金融大數據產業(yè)將迎來黃金增長期,大數據也將成為助推“大眾創(chuàng)業(yè)、萬眾創(chuàng)新”浪潮的有力抓手。
本書為適應高等學校互聯網金融專業(yè)人才培養(yǎng)的需要,從理論聯系實際的原則出發(fā),以大數據的實際運用為導向,對大數據在金融各行業(yè)的應用做了全面系統(tǒng)的介紹。
全書共分為8章,包括大數據金融概述、大數據相關技術、大數據在商業(yè)銀行中的應用、大數據在證券行業(yè)中的應用、大數據在保險行業(yè)中的應用、大數據在互聯網金融中的應用、大數據征信、大數據與中國金融信息安全。
由于大數據金融剛剛興起,可供參考的資料不多,本書也僅僅是在這方面的一個探索,故全書整體框架以編者自己的思路進行呈現。本書以應用特別是金融領域前沿的應用為導向,以在各行業(yè)的實踐為主線展開。本書內容新穎全面,論述問題極具現實意義。本書可以作為高等院校互聯網金融專業(yè)相關課程的教材,也可供互聯網金融研究者、從業(yè)者、管理人員參考。
全書主要有以下兩大特點。
(1) 內容全面。
本書以大數據為出發(fā)點,結合國內外的發(fā)展現狀及最新模式,系統(tǒng)地介紹了大數據在銀行業(yè)、證券業(yè)、保險業(yè)、互聯網金融行業(yè)及征信中的應用,并強調了在應用過程中,中國金融信息安全的重要性及保障機制。本書內容涵蓋面極廣,有效地為各行各業(yè)的讀者提供了大數據金融與征信的宏觀視圖。
(2) 體例新穎。
本書秉承著注重實際運用的宗旨,編寫體例上彰顯了可讀性和互動性。每章前有“本章目標”和“本章簡介”,每章末有“本章總結”和“本章作業(yè)”。書中除了理論教學,還配有相關案例和解析,使理論與實踐相結合,通俗易懂,開拓了學生的視野,可以更好地滿足培養(yǎng)既懂專業(yè)知識又能運用所學知識解決實際問題的“復合型”經濟人才需求。
本書由新邁爾(北京)特技有限公司組織研發(fā),由何平平擬定大綱并進行統(tǒng)稿,湖南大學互聯網金融研究所組織撰寫。本書由何平平、車云月擔任主編,以下研究生也參與了本書的編寫:王楊毅彬、周春亞、張童、劉詩雨、劉晶宇。
本書編寫過程中參考了大量的文獻資料,有些已經在書后的參考文獻中標注,而有些沒有,在此一并表示感謝。囿于時間和個人能力,書中難免有疏漏和不妥之處,敬請讀者批評指正。
何平平
車云月,五洲樹人教育投資有限公司創(chuàng)始人,知名職教專家,創(chuàng)新型校企合作國內領軍人物,“5411”教育理念創(chuàng)始人。擔任新邁爾教育集團總裁,中關村加一戰(zhàn)略新興產業(yè)人才發(fā)展中心主任等職位。在IT類創(chuàng)新和綜合性人才培養(yǎng)等方面都做出了突破性的創(chuàng)新。憑借其多年的教育行業(yè)從業(yè)經驗與實干精神,打開了國內職業(yè)教育的新局面。近年來更涉足國際教育領域,力爭使我國的職業(yè)教育更加國際化,培養(yǎng)更加國際化的專業(yè)人才。
何平平,博士,副教授,碩士研究生導師,主持完成國家自然科學基金項目1項,教育部人文社會科學規(guī)劃項目1項,省社科基金重點項目1項,省科技項目5項,企業(yè)委托研究項目2項,出版專著1部,教材1部,發(fā)表論文20余篇,現在湖南大學金融與統(tǒng)計學院工作,任湖南大學互聯網金融研究所所長。
第1章 大數據金融概述 1
1.1 大數據概述 2
1.1.1 大數據的內涵與特征 2
1.1.2 大數據的分類 7
1.1.3 大數據的價值 8
1.2 大數據應用領域 10
1.2.1 商業(yè) 10
1.2.2 通信 11
1.2.3 醫(yī)療 13
1.2.4 金融 16
1.3 大數據金融的內涵、特點與優(yōu)勢 18
1.3.1 大數據金融的內涵 18
1.3.2 大數據金融的特點 19
1.3.3 大數據金融相對于傳統(tǒng)
金融的優(yōu)勢 20
1.4 大數據帶來金融業(yè)大變革 20
1.4.1 大數據帶來銀行業(yè)大變革 21
1.4.2 大數據帶來保險業(yè)大變革 22
1.4.3 大數據帶來證券業(yè)大變革 23
1.4.4 大數據帶來征信行業(yè)大變革 25
1.4.5 互聯網金融中的大數據應用 26
1.5 大數據金融模式 27
1.5.1 平臺金融模式 27
1.5.2 供應鏈金融模式 29
1.6 大數據金融信息安全 30
1.7 大數據應用案例 30
1.7.1 案例之一:滴滴出行 30
1.7.2 案例之二:大數據與美團
外賣的精細化運營 34
本章總結 43
本章作業(yè) 44
第2章 大數據相關技術 45
2.1 大數據處理流程 46
2.1.1 數據采集 46
2.1.2 數據預處理 47
2.1.3 數據存儲 48
2.1.4 數據挖掘 48
2.1.5 數據解釋 49
2.2 數據來源 49
2.2.1 核心數據 50
2.2.2 外圍數據 52
2.2.3 常規(guī)渠道數據 53
2.3 大數據架構 54
2.3.1 HDFS系統(tǒng) 56
2.3.2 MapReduce 60
2.3.3 HBase 62
2.4 數據挖掘方法 63
2.4.1 分類分析 64
2.4.2 回歸分析 65
2.4.3 其他方法 66
本章總結 69
本章作業(yè) 70
第3章 大數據在商業(yè)銀行中的應用 71
3.1 客戶關系管理 72
3.1.1 客戶細分 72
3.1.2 預見客戶流失 74
3.1.3 高效渠道管理 75
3.1.4 推出增值服務,提升客戶
忠誠度 75
3.1.5 案例——大數據幫助商業(yè)銀行
改善與客戶的關系 76
3.2 精準營銷 76
3.2.1 客戶生命周期管理 77
3.2.2 實時營銷 78
3.2.3 交叉營銷 79
3.2.4 社交化營銷 80
3.2.5 個性化推薦 81
3.3 信貸管理 82
3.3.1 貸款風險評估 82
3.3.2 信用卡自動授信 84
3.3.3 案例——大數據為商業(yè)銀行
信貸管理提供更多可能 85
3.4 風險管理 86
3.4.1 大數據風險控制與傳統(tǒng)風險
控制的區(qū)別 86
3.4.2 基于大數據的銀行風險管理
模式 89
3.4.3 反欺詐 95
3.4.4 反洗錢 99
3.5 運營優(yōu)化 101
3.5.1 市場和渠道分析優(yōu)化 101
3.5.2 產品和服務優(yōu)化 103
3.5.3 網絡輿情分析 104
3.5.4 案例——大數據分析助力
手機銀行優(yōu)化創(chuàng)新 106
本章總結 108
本章作業(yè) 109
第4章 大數據在證券行業(yè)中的應用 111
4.1 大數據在股票分析中的應用 112
4.1.1 基于基本面分析的數據挖掘
方法 112
4.1.2 基于技術分析的數據挖掘
方法 113
4.1.3 決策樹法的應用 114
4.1.4 聚類分析法的應用 115
4.1.5 人工神經網絡算法的應用 116
4.2 客戶關系管理 119
4.2.1 客戶細分 119
4.2.2 客戶滿意度 122
4.2.3 流失客戶預測 124
4.3 投資情緒分析 127
4.3.1 投資者情緒的測量 127
4.3.2 基于網絡輿情的投資者情緒
分析 129
4.4 大數據與量化投資 134
4.4.1 量化投資概述 134
4.4.2 證券量化投資中的主要分析
工具 135
4.4.3 大數據在證券量化投資中的
應用 136
本章總結 139
本章作業(yè) 140
第5章 大數據在保險業(yè)中的應用 141
5.1 大數據保險 142
5.1.1 大數據保險的概念和特征 142
5.1.2 保險業(yè)大數據應用的階段 143
5.1.3 大數據在保險行業(yè)中的
作用 144
5.1.4 大數據下的數據服務架構 146
5.1.5 保險業(yè)大數據應用現狀 147
5.2 承保定價 150
5.2.1 大數據與傳統(tǒng)保險定價
理論 150
5.2.2 大數據對承保定價的革新 151
5.2.3 大數據在車險定價中的
應用 153
5.2.4 大數據在健康險定價中的
應用 156
5.3 精準營銷 162
5.3.1 保險精準營銷 162
5.3.2 大數據與保險精準營銷 164
5.3.3 組建垂直平臺生態(tài)圈 167
5.3.4 大數據精準營銷在保險業(yè)中的
應用 169
5.4 欺詐識別 171
5.4.1 保險欺詐 171
5.4.2 大數據與保險反欺詐 173
5.4.3 大數據與車險反欺詐 176
5.4.4 大數據與健康險的理賠
風險 180
本章總結 182
本章作業(yè) 183
第6章 互聯網金融中的大數據應用 185
6.1 基于大數據的第三方支付欺詐
風險管理 186
6.1.1 第三方支付中的欺詐風險 186
6.1.2 大數據應用與欺詐
風險防范 186
6.2 大數據在網絡借貸中的應用 189
6.2.1 推薦系統(tǒng)簡述 189
6.2.2 P2P網站中的個性化推薦 190
6.2.3 基于VITA系統(tǒng)的信貸產品
匹配機制 191
6.3 大數據在互聯網供應鏈金融中的
應用 193
6.3.1 基于大數據的互聯網企業(yè)
信用評估 194
6.3.2 案例:京東供應鏈金融
模式 197
6.4 大數據在互聯網消費金融中的
應用 198
6.4.1 互聯網消費金融的大數據
征信與風控 198
6.4.2 案例:芝麻信用 199
本章總結 199
本章作業(yè) 200
第7章 大數據征信 201
7.1 傳統(tǒng)征信 202
7.1.1 征信概述 202
7.1.2 征信的基本流程 209
7.1.3 征信行業(yè)產業(yè)鏈 212
7.1.4 征信產品 212
7.1.5 征信機構 216
7.1.6 征信體系 218
7.2 大數據征信 227
7.2.1 大數據征信概述 227
7.2.2 大數據征信的理論基礎 230
7.2.3 大數據征信流程 233
7.3 大數據征信典型企業(yè) 233
7.3.1 國外大數據征信典型企業(yè) 233
7.3.2 國內大數據征信典型企業(yè) 242
本章總結 249
本章作業(yè) 250
第8章 大數據與中國金融信息安全 251
8.1 金融信息安全的重要性 252
8.1.1 金融信息安全的含義 252
8.1.2 金融信息安全的屬性特征 253
8.1.3 金融信息安全的重要性 254
8.2 大數據給我國金融信息安全帶來的
機遇和挑戰(zhàn) 256
8.2.1 大數據給金融信息安全
帶來的機遇 256
8.2.2 大數據給我國金融信息
安全帶來的挑戰(zhàn) 257
8.2.3 案例:美國“棱鏡門”
事件 259
8.3 大數據金融信息安全風險 263
8.3.1 大數據金融信息安全風險的
類型 263
8.3.2 大數據金融信息安全風險的
特征 266
8.3.3 國內外金融信息安全事件及
事故 268
8.4 我國金融信息安全現狀及
制約因素 272
8.4.1 我國金融信息安全現狀 272
8.4.2 我國金融信息安全的
制約因素 274
8.5 美國金融信息安全保障機制 275
8.5.1 美國金融信息安全保障
機制的特點 275
8.5.2 美國金融信息安全保障
機制的主要做法 276
8.6 我國金融信息安全建設 277
8.6.1 完善頂層設計,盡快構建適應
我國金融發(fā)展需要的金融信息
安全保障體系 277
8.6.2 盡快制定我國金融行業(yè)國產
信息技術產品和服務替代
戰(zhàn)略 277
8.6.3 盡快制定金融行業(yè)自主可控
戰(zhàn)略實施步驟,推進自主可
控國家戰(zhàn)略 278
8.6.4 應用大數據進行信息安全
分析 278
本章總結 278
本章作業(yè) 279
參考文獻 281
第2章 大數據相關技術
本章目標
* 掌握大數據處理流程:數據采集、預處理、存儲、挖掘和解釋
* 掌握大數據的3種來源:核心數據、外圍數據、常規(guī)渠道數據
* 掌握大數據的主要架構
* 掌握數據挖掘常用方法
本章簡介
本章從大數據處理流程、數據來源、大數據生態(tài)圈及主要架構、數據挖掘的主要方法幾個方面來介紹大數據的相關技術。
2.1 大數據處理流程
大數據的處理流程歸納為:首先利用多種輕型數據庫收集海量數據,對不同來源的數據進行預處理后,整合存儲到大型數據庫中;然后根據企業(yè)或個人目的和需求,運用合適的數據挖掘技術提取有益的知識;最后利用恰當的方式將結果展現給終端用戶。具體包括:數據采集、數據預處理、數據存儲、數據挖掘及數據解釋這5個步驟,如圖2.1所示。
圖2.1 大數據的處理流程
2.1.1 數據采集
大數據的采集是大數據處理過程中的第一步,它是數據分析和挖掘的基礎。大數據的采集是指在確定用戶目標的基礎上,對該范圍內的所有結構化、半結構化、非結構化數據進行采集的過程。采集的數據大部分是瞬時值,還包括某時段內的特征值。大數據的主要來源有商業(yè)數據、互聯網數據、傳感器數據。針對不同來源的數據,具有不同的采集方法。主要的大數據采集方法有系統(tǒng)日志采集方法、網絡數據采集方法、其他數據采集方法。
1. 系統(tǒng)日志采集方法
大多數互聯網企業(yè)都有自己的海量數據采集工具,常用于系統(tǒng)日志采集,如Scribe、 Flume、Chukwa、Kafka等。Scribe是Facebook開源的日志收集系統(tǒng),能夠從各種日志源收集日志,存儲到一個中央存儲系統(tǒng)中,以便于進行集中統(tǒng)計分析和處理;Chukwa屬于Hadoop系列產品,是一個大型的分布式系統(tǒng)監(jiān)測數據的收集系統(tǒng),提供了很多模塊以支持Hadoop集群分析;Flume是cloudera的開源日志系統(tǒng),能夠有效地收集匯總和移動大量的實時日志數據。這些工具均采用分布式架構,能滿足每秒數百MB的日志數據采集和傳輸需求。
2. 網絡數據采集方法
網絡數據采集是指利用互聯網搜索引擎技術從網站抓取數據信息。目前,網絡數據的采集基本上是利用垂直搜索引擎技術的網絡爬蟲或數據采集機器人、分詞系統(tǒng)、任務與索引系統(tǒng)等技術進行綜合運用而完成。該方法可以將非結構化數據從網頁中抽取出來,將其存儲為統(tǒng)一的本地數據文件,并以結構化的方式存儲。它支持圖片、音頻、視頻等文件或附件的采集,附件與正文可以自動關聯。除了網絡中包含的內容之外,對于網絡流量的采集可以使用DPI或DFI等帶寬管理技術進行處理。
3. 其他數據采集方法
對于企業(yè)生產經營數據或學科研究數據等保密性要求較高的數據,可以通過與企業(yè)或研究機構合作,使用特定系統(tǒng)接口等相關方式采集數據。
在大數據的采集過程中,同一網站同一時間可能會有很多用戶訪問和操作。例如,火車票售票網站和淘寶,它們并發(fā)的訪問量在峰值時超過了上百萬,并發(fā)數十分高。因此,需要在采集端部署大量數據庫才能支撐。
2.1.2 數據預處理
由于第一步收集得到的數據是原始數據,存在著不完整、不一致的問題,無法直接存儲到數據庫中進行數據挖掘。因此,在將來自前端的數據導入一個集中的大型數據庫或者分布式存儲集群前,需要對大數據進行預處理,這樣不但能夠節(jié)約大量的空間和時間,還能得到更好的數據挖掘結果。大數據預處理包括對數據進行清理、集成、變換和歸約4個過程。
1. 數據清理
數據清理是數據準備過程中最乏味也是最關鍵的一步。其目的是填補缺失的數據、平滑噪聲數據、刪除冗余數據、糾正錯誤數據、清除異常數據,將原始的數據格式進行標準化。
……