熟練使用Oracle R Enterprise大數(shù)據(jù)功能
《精通Oracle R Enterprise大數(shù)據(jù) 在Oracle數(shù)據(jù)庫中充分利
用R的強(qiáng)大功能》指導(dǎo)你高效管理企業(yè)大數(shù)據(jù),順暢運(yùn)行復(fù)雜流
程。本書簡明實(shí)用,分步講解如何創(chuàng)建和執(zhí)行大規(guī)模預(yù)測性分析
并保持卓越性能。通過本書的學(xué)習(xí),你將能分析和準(zhǔn)備數(shù)據(jù)、準(zhǔn)
確建立業(yè)務(wù)流程模型、生成精密圖形、編寫和部署功能強(qiáng)大的腳
本,并能將Oracle R Enterprise功能有效地運(yùn)用于APEX應(yīng)用程序、
OBIEE儀表板以及Apache Hadoop系統(tǒng)。
主要內(nèi)容
● 安裝、配置和管理Oracle R Enterprise
● 建立連接并將數(shù)據(jù)移到數(shù)據(jù)庫
● 創(chuàng)建Oracle R Enterprise包和函數(shù)
● 使用R語言處理Oracle Database中的數(shù)據(jù)
● 使用ODM、ORE和其他算法構(gòu)建模型
● 開發(fā)和部署R腳本以及使用R腳本庫
● 執(zhí)行嵌入式R腳本,使用ORE SQL API函數(shù)
● 使用Oracle R Advanced Analytics for Hadoop映射和操縱數(shù)據(jù)
● 在Oracle Data Miner、OBIEE和其他應(yīng)用程序中使用ORE
Brendan Tierney是Oracle ACE總監(jiān),是都柏林理工學(xué)院的數(shù)據(jù)科學(xué)、數(shù)據(jù)庫和大數(shù)據(jù)講師,也是一位獨(dú)立咨詢師(Oralytics)。Brendan曾在愛爾蘭、英國、比利時(shí)、荷蘭、挪威、西班牙、加拿大和美國等多個(gè)國家的項(xiàng)目中工作,在數(shù)據(jù)挖掘、數(shù)據(jù)科學(xué)、大數(shù)據(jù)和數(shù)據(jù)倉庫領(lǐng)域擁有逾24年的工作經(jīng)驗(yàn),是公認(rèn)的數(shù)據(jù)科學(xué)和大數(shù)據(jù)專家。Brendan是Oracle User Group社區(qū)的活躍分子,是OUG在愛爾蘭的領(lǐng)導(dǎo)者之一。Brendan是UKOUG Oracle Scene雜志的編輯,定期在全球技術(shù)會(huì)議上發(fā)表演講;也是一位活躍的博客寫手,曾為OTN、Oracle Scene、IOUG SELECT Journal、ODTUG Technical Journal和ToadWorld撰寫文章。他還是位于愛爾蘭的DAMA的董事會(huì)成員。Brendan已撰寫Predictive Analytics Using Oracle Data Miner和 Real World SQL and PL/SQL: Advice from the Experts兩本書籍。
Web和blog: www.oralytics.comTwitter: @brendantierney
目 錄
第1章
Oracle R Enterprise簡介 1
1.1 本書的目標(biāo) 3
1.2 Oracle Advanced Analytics
選件 4
1.3 Oracle R Enterprise(Oracle R
企業(yè)版) 5
1.4 利用Oracle R Enterprise易于
部署R 7
1.5 Oracle的R技術(shù) 9
1.6 客戶如何使用Oracle R
Enterprise和Oracle Advanced
Analytics 10
1.7 小結(jié) 11
第2章
安裝Oracle R Enterprise 13
2.1 安裝的先決條件 13
2.2 設(shè)置Oracle Database 14
2.3 安裝Oracle R Enterprise 15
2.3.1 Oracle R Enterprise的
軟件包 15
2.3.2 安裝前的要求 16
2.3.3 在Oracle
Database Server
上的安裝 17
2.3.4 安裝客戶端 22
2.4 驗(yàn)證ORE的安裝 25
2.5 安裝RStudio 26
2.6 使用Oracle的預(yù)制應(yīng)用 27
2.6.1 預(yù)制應(yīng)用Oracle
Database
Developer
27
2.6.2 預(yù)制應(yīng)用Oracle
OBIEE
Sample
App 28
2.6.3 預(yù)制應(yīng)用Oracle
Big Data
Lite
29
2.7 小結(jié) 29
第3章
Oracle R Enterprise入門 31
3.1 創(chuàng)建和管理到數(shù)據(jù)庫的ORE
連接 31
3.1.1 使用ore.connect創(chuàng)建ORE
連接 32
3.1.2 使用ore.sync同步數(shù)據(jù) 33
3.1.3 使用ore.attach將對(duì)象加入
搜索空間 35
3.2 執(zhí)行SQL命令 36
3.3 在Oracle Database中處理
數(shù)據(jù) 36
3.4 在數(shù)據(jù)庫中存儲(chǔ)數(shù)據(jù) 40
3.4.1 使用ore.creat函數(shù)建表 40
3.4.2 使用ore.drop函數(shù)刪除表 40
3.4.3 ore.create函數(shù)和ore.drop
函數(shù)組合使用的示例 41
3.5 在數(shù)據(jù)庫自帶的R Datastore中
存儲(chǔ)ORE對(duì)象 41
3.6 斷開與數(shù)據(jù)庫的連接 46
3.7 小結(jié) 46
第4章
透明層
47
4.1 透明層概述 47
4.2 探尋ORE透明層背后的
真相 50
4.3 小結(jié) 53
第5章
Oracle R Enterprise程序包 55
5.1 Oracle R Enterprise程序包 55
5.2 探索ORE包函數(shù)和程序包
版本 57
5.3 ORE設(shè)置和選項(xiàng) 59
5.4 獲得ORE的幫助 61
5.5 ORE演示腳本 62
5.6 小結(jié) 66
第6章
探索數(shù)據(jù) 67
6.1 探索性數(shù)據(jù)分析(EDA) 68
6.2 數(shù)據(jù)抽樣 73
6.3 數(shù)據(jù)聚合 78
6.4 數(shù)據(jù)轉(zhuǎn)換 80
6.4.1 派生屬性 80
6.4.2 分塊屬性 81
6.4.3 組合數(shù)據(jù) 82
6.5 數(shù)據(jù)排序 82
6.6 小結(jié) 83
第7章
使用ODM算法建立模型 85
7.1 Oracle Data Mining(Oracle
數(shù)據(jù)挖掘)
86
7.1.1 ORE中可用的ODM算法 87
7.1.2 利用OREdm軟件包在Oracle
中進(jìn)行自動(dòng)數(shù)據(jù)準(zhǔn)備 87
7.2 使用OREdm軟件包建立模型
和對(duì)數(shù)據(jù)進(jìn)行評(píng)分 88
7.2.1 屬性重要性 88
7.2.2 關(guān)聯(lián)規(guī)則分析 89
7.2.3 決策樹 92
7.2.4 支持向量機(jī) 94
7.2.5 樸素貝葉斯 98
7.2.6 廣義線性模型 99
7.2.7 聚類
100
7.3 保存數(shù)據(jù)挖掘模型 101
7.4 小結(jié) 103
第8章
利用ORE和其他算法建立
模型 105
8.1 什么算法是可用的? 106
8.2 為建模而準(zhǔn)備數(shù)據(jù) 106
8.3 使用ORE算法建立模型 107
8.3.1 廣義線性模型 108
8.3.2 線性和逐步回歸模型 109
8.3.3 神經(jīng)網(wǎng)絡(luò) 111
8.3.4 隨機(jī)森林 112
8.4 使用R軟件包和算法構(gòu)建
模型 113
8.5 使用ore.predict優(yōu)化數(shù)據(jù)庫自
帶的評(píng)分過程 115
8.6 小結(jié) 117
第9章
在用戶定義的R腳本庫中
生成R腳本 119
9.1 使用R腳本庫 120
9.2 創(chuàng)建和刪除R腳本
120
9.3 授予和撤消用戶定義的R
腳本的特權(quán) 122
9.4 管理R Script Repository 123
9.5 使用SQL API創(chuàng)建腳本 123
9.5.1 創(chuàng)建一個(gè)R腳本 124
9.5.2 刪除一個(gè)腳本 126
9.5.3 授予和撤消訪問權(quán)限 126
9.5.4 用戶定義的R腳本的數(shù)據(jù)
字典視圖 127
9.6 小結(jié) 127
第10章
嵌入式R執(zhí)行 129
10.1 通過R接口使用嵌入式R
執(zhí)行 129
10.1.1 如何使用ore.doEval
函數(shù) 130
10.1.2 如何使用ore.tableApply
函數(shù) 132
10.1.3 如何使用ore.groupApply
函數(shù) 134
10.1.4 如何使用ore.rowApply
函數(shù) 135
10.1.5 如何使用ore.indexApply
函數(shù) 136
10.1.6 并行執(zhí)行嵌入式R
函數(shù) 137
10.2 通過SQL接口使用嵌入式
R執(zhí)行 138
10.2.1 如何使用rqEval
SQL
函數(shù) 138
10.2.2 如何使用SQL
函數(shù)rqTableEval
140
10.2.3 如何使用SQL
函數(shù)rqGroupEval
144
10.2.4 如何使用SQL函數(shù)
rqRowEval
146
10.3 小結(jié) 147
第11章
針對(duì)Hadoop的Oracle R
Advanced Analytics 149
11.1 連接到Apache Hive上并處理
數(shù)據(jù) 152
11.2 使用ORCH管理Map-Reduce
作業(yè) 155
11.3 通過ORAAH使用Spark 157
11.4 小結(jié) 158
第12章
通過Oracle Data Mining
使用ORE 159
12.1 Oracle Data Mining 160
12.2 Oracle Data Miner 164
12.3 通過SQL Node來包含R
腳本 165
12.4 使用R節(jié)點(diǎn) 167
12.5 小結(jié) 168
第13章
在APEX和OBIEE中使用
ORE 171
13.1 Oracle APEX 171
13.1.1 在APEX應(yīng)用程序中
包含ORE腳本 173
13.1.2 向APEX應(yīng)用程序中
添加R圖形 175
13.2 Oracle
Business Intelligence 177
13.2.1 設(shè)置OBIEE以便能
使用ORE
178
13.2.2 在OBIEE
RPD中使用
R腳本 180
13.2.3 在儀表板上呈現(xiàn)由R
腳本產(chǎn)生的結(jié)果 180
13.3 小結(jié) 182
第14章
針對(duì)Oracle DBA的
ORE 183
14.1 在數(shù)據(jù)庫中創(chuàng)建一個(gè)新的
ORE模式 183
14.2 在Oracle R Enterprise中
安裝新的R軟件包 184
14.2.1 在數(shù)據(jù)庫服務(wù)器上安裝新
的R軟件包 185
14.2.2 在客戶機(jī)上安裝新
軟件包 186
14.3 ORE的全局變量和選項(xiàng) 187
14.4 使用ore.parallel特性 189
14.5 卸載Oracle R Enterprise 189
14.5.1 從Oracle
Database服務(wù)
器中卸載Oracle
R
Enterprise
190
14.5.2 從客戶端卸載Oracle
R Enterprise 191
14.6 小結(jié) 192