本書屬于高等學校各個專業研究生和本科生的信息檢索素養課程教學通用教材,內容包括三大部分:*部分信息檢索素養基礎知識篇,第二部分信息檢索素養基本原理篇和第三部分信息檢索素養實踐應用篇,共13章內容。本書較好地把現代信息檢索素養知識的基礎性與前沿性、原理性與實踐性、全面性與主題性、引導性與啟發性進行了貫通與融合。在基于大量信息檢索專題、圖表、實例及其數學理論依據進行充分闡述和說明的基礎上,突出國內與國外、理論與實踐緊密結合的信息檢索素養教學要求。考慮到不同專業和不同層次學生的實際教學需要,教學內容組織依據循序漸進和主題性教學相結合的原則,可以適當選用部分章節組織教學。例如,針對計算機學科專業、圖書情報學專業、信息管理專業本科生和各個專業的研究生層次學生,可以把第二部分信息檢索素養基本原理篇作為重點來組織各個教學章節內容。
本書內容豐富、線索清晰、結構完整、語言精練、主題鮮明,是高等學校各個專業研究生和本科生的信息檢索素養教學通用教材。既可以作為信息檢索素養基礎必修課教材,也可以作為部分專業和圖書館用戶教育的選修課教材,同時可作為信息系統設計與開發、數據采集與挖掘、信息檢索與咨詢服務、圖書情報機構等從業人員的學習與培訓參考用書。
1.基于循序漸進和主題性教學原則。本書較好地把現代信息檢索素養知識的原理性與實踐性、全面性與主題性、引導性與啟發性進行了貫通與融合。在基于大量信息檢索原理與知識的專題、圖表、實例、案例及其數學理論依據進行充分闡述和說明的基礎上,突出國內與國外、基礎與前瞻、知識與技能緊密結合的信息檢索素養教學要求。 2.適用面廣。考慮到不同專業和不用層次學生的實際教學需要,本書內容可作為高等學校各個專業研究生和本科生的信息檢索素養課程通用教材。 3.本書內容豐富、線索清晰、結構完整、語言精練、主題鮮明。本書既可作為信息檢索素養基礎必修課教材,也可以作為部分專業和圖書館用戶教育的選修課教材,同時還可作為信息系統設計與開發、數據采集與挖掘、信息檢索與咨詢服務、圖書情報機構等從業人員的拓展學習與培訓參考用書。
前言在信息化社會越來越發達的今天,面對幾何級數膨脹的海量信息資源,如何有效地檢索、獲取、評估、傳播、共享和利用信息,成為了每個人重要的基本素養和能力要求,因為信息需求是每個人學習、工作、生活及其社會活動中十分重要而且迫切的需求。作為信息時代的大學生,需要重視信息檢索素養的知識學習與能力培養。信息檢索素養的理論知識學習與基本能力形成,不僅直接影響著大學生的在校學業表現,也較大程度上影響著他們今后的學習、工作與事業發展(例如終身學習、創新創業等持續性需要)。大學生信息檢索素養是大學生信息素養的核心內容之一,具有多學科交叉融合的特性。信息檢索起源于圖書館學、情報學的信息檢索原理與技術,早期直接服務于高校圖書館或社會公共圖書館的信息檢索用戶教育與技能培訓,后來廣泛應用于數據庫研發與服務企業、搜索引擎等信息服務產業,在當今高速發展的計算機科學、軟件工程、網絡工程、通信工程、管理學、應用數學、統計學、語言學等多學科交叉融合的基礎上,信息檢索在數據挖掘、大數據處理等領域不斷深化并發揮著日益強大的潛能。大學生信息檢索素養教育正是基于這種時代背景和學科發展提出來的,也是面向大學生的傳統信息素養教育和信息檢索教育的不斷深化與交叉融合的發展結果。基于循序漸進和主題性教學原則,本書較好地把現代信息檢索素養知識的原理性與實踐性、全面性與主題性、引導性與啟發性進行了貫通與融合。在基于大量信息檢索原理與知識的專題、圖表、實例、案例及其數學理論依據進行充分闡述和說明的基礎上,突出國內與國外、基礎與前瞻、知識與技能緊密結合的信息檢索素養教學要求。考慮到不同專業和不同層次學生的實際教學需要,本教材屬于高等學校各個專業研究生和本科生的信息檢索素養課程通用教材,內容包括三大部分: 第一部分信息檢索素養基礎知識篇,第二部分信息檢索素養基本原理篇和第三部分信息檢索素養實踐應用篇。本書邏輯清晰,內容豐富,結構完整。首先,從信息檢索素養的基本概念、內涵、發展動因、特點、核心內容與能力表現、信息檢索素養的評價標準以及信息化社會對大學生的信息檢索素質需要出發,進一步論述信息檢索與知識產權、信息檢索與大學生學術不端行為、信息檢索基礎知識、信息檢索方法與策略等內容來培養學生的信息檢索意識、信息檢索道德與信息檢索基礎。第二,通過信息檢索的基礎數學原理的引入,使得信息檢索有了更加嚴謹的邏輯論證,檢索過程和信息需求的本質描述也更為精確,從而使得信息檢索的理論與實踐獲得持續性的基礎支撐。通過文本分類與文本索引構建、圖像信息檢索、音頻信息檢索、視頻信息檢索和Web信息搜索一般性原理來構建大學生特別是研究生的信息檢索基本原理知識。第三,通過搜索引擎的檢索應用、七大類特種文獻信息資源檢索和圖書與學術期刊論文檢索的大量實例與檢索案例來培養和鍛煉大學生的信息檢索素養實踐技能。本書教學內容的規劃、組織與編著,是在作者講授研究生信息檢索原理與應用課程和本科生大學生信息檢索課程的十多年教學改革與實踐經驗基礎上逐步積累形成的。同時,在教材編著過程中,參考和借鑒了大量國內外專著、教材、學術期刊論文、學位論文、學術觀點和典型網絡數據庫檢索平臺等成果,在此一并向他們表示真摯的謝意!本書內容豐富、線索清晰、結構完整、語言精練、主題鮮明,是高等學校各個專業研究生和本科生的信息檢索素養教學通用教材。既可以作為信息檢索素養基礎必修課教材,也可以作為部分專業和圖書館用戶教育的選修課教材,同時可作為信息系統設計與開發、數據采集與挖掘、信息檢索與咨詢服務、圖書情報機構等從業人員的學習與培訓參考用書。在本書編著過程中,得到桂林電子科技大學研究生院領導及教學督導委員會的關心與支持,獲得2016年桂林電子科技大學研究生教育質量工程專項(YXYJ2900)、2016年廣西學位與研究生教育改革與發展專項(2016XWYJ12)和2015年廣西高等教育本科教學改革工程項目(2015JGA207)的支持與資助。本書能夠順利出版,感謝清華大學出版社的大力支持與良好合作,感謝出版社編輯們的辛勤工作與付出!本書主要基于循序漸進性教學與主題性教學相結合的編寫原則,在大學生信息檢索素養的原理性與實踐性、全面性與主題性、引導性與啟發性等方面難免有疏漏或不妥之處,懇請讀者批評指正。 /大學生信息檢索素養教程前言/
作者2016年7月于桂林
目錄
第一部分信息檢索素養基礎知識篇
第1章大學生信息檢索素養概述3
1.1信息檢索素養概述4
1.1.1信息檢索素養的基本概念4
1.1.2大學生信息檢索素養的內涵5
1.1.3信息檢索素養的發展動因6
1.1.4信息檢索素養的特點7
1.2信息檢索素養的主要內容9
1.2.1信息檢索意識9
1.2.2信息檢索能力10
1.2.3信息檢索道德10
1.3信息檢索素養的評價標準11
1.3.1有信息檢索素養的人11
1.3.2信息檢索素養評價標準的必要性12
1.3.3大學生信息檢索素養評價標準13
1.4我國當代大學生的信息檢索素養現狀14
1.4.1信息檢索意識較弱14
1.4.2獲取信息的檢索能力不強14
1.4.3加工與利用信息的能力較差14
1.4.4信息道德和信息法規意識急需培養14
1.5大學生信息檢索素養教育與培養的意義15
1.5.1信息化社會對大學生的信息檢索素質需求15
1.5.2創新創業能力培養的需要16
1.5.3掌握有效信息和開展科研與學術活動的需要171.5.4提供科學方法與正確決策的需要18
1.5.5終身學習的需要19
本章小結19
本章思考與練習題21
/大學生信息檢索素養教程目錄/
第2章信息檢索與知識產權22
2.1信息與知識產權22
2.1.1信息22
2.1.2知識產權26
2.1.3知識產權信息27
2.1.4知識產權信息的概念特征28
2.1.5知識產權信息的內容29
2.2信息檢索與利用的法律規范和信息道德29
2.2.1信息檢索與利用的相關法律制度30
2.2.2知情權問題31
2.2.3國家秘密問題32
2.2.4商業秘密問題33
2.2.5隱私權保護問題33
2.2.6信息復制權保護問題34
2.3信息檢索與利用過程中的道德自律34
2.3.1法律約束的局限性35
2.3.2信息道德自律問題的提出35
2.3.3信息道德的培養和內省原則36
2.4信息檢索與利用同知識產權保護的相互影響36
2.4.1信息檢索與利用對知識產權保護既制約又促進36
2.4.2知識產權保護對信息檢索與信息資源共享的制約和促進37
2.5大學生信息檢索素養與學術不端行為的關聯38
2.5.1大學生學術不端行為的界定38
2.5.2大學生學術不端行為的表現39
2.5.3信息檢索素養教育對大學生學術不端行為的作用40
本章小結41
本章思考與練習題43第3章信息檢索的基本知識44
3.1信息檢索的含義44
3.1.1檢索的概念44
3.1.2信息檢索的含義45
3.1.3信息檢索用戶的基礎素養46
3.1.4信息檢索的領域與范疇47
3.1.5信息檢索的類型48
3.2信息檢索涉及的相關支撐領域49
3.3信息檢索的前沿與熱點問題51
3.3.1信息檢索的發展趨勢51
3.3.2信息檢索的熱點問題55
本章小結57
本章思考與練習題58第4章信息檢索的方法與策略59
4.1信息源及其類型59
4.2信息源的出版發行與共享類型61
4.3信息源類型的辨別64
4.4檢索工具67
4.4.1檢索工具的基本功能67
4.4.2檢索工具的類型69
4.5信息檢索途徑73
4.6信息檢索方法82
4.7信息檢索策略84
4.8信息檢索質量與評價87
4.8.1信息檢索質量與評價指標88
4.8.2影響檢索效果的因素89
本章小結91
本章思考與練習題91
第二部分信息檢索素養基本原理篇
第5章信息檢索的基礎數學原理95
5.1簡單布爾檢索95
5.1.1基本原理95
5.1.2布爾檢索模型的特點97
5.2信息檢索模糊集合論98
5.2.1模糊檢索的數學描述99
5.2.2信息文檔對標引詞的隸屬度100
5.2.3提問檢索詞的相關性描述100
5.3擴展布爾檢索102
5.3.1基于兩個標引詞的情形102
5.3.2推廣到n個標引詞空間103
5.4信息檢索代數模型106
5.4.1信息檢索向量空間模型106
5.4.2潛在語義索引模型113
5.4.3神經網絡檢索模型117
5.5概率論檢索模型122
5.5.1經典概率檢索模型123
5.5.2貝葉斯網絡檢索模型125
5.6其他檢索模型的一般數學原理129
5.6.1進化計算與遺傳算法129
5.6.2粗糙集理論136
5.6.3瀏覽檢索模型140
本章小結142
本章思考與練習題144第6章文本分類與文本索引構建145
6.1文本分類概述146
6.2樸素貝葉斯文本分類148
6.2.1貝葉斯分類器148
6.2.2條件概率和乘法定理149
6.2.3極大后驗假設和極大似然假設149
6.2.4貝葉斯定理150
6.2.5多項式樸素貝葉斯151
6.3樸素貝葉斯分類模型改進153
6.3.1改進方法153
6.3.2樸素貝葉斯分類的提升模型155
6.3.3基于特征相關的改進加權樸素貝葉斯分類156
6.4貝努利文本分類模型157
6.5多項式文本分類模型與貝努利文本分類模型的性質比較159
6.6文本分類特征選擇161
6.6.1文本分類特征選擇的作用161
6.6.2特征選擇的方法162
6.6.3特征選擇方法類型163
6.6.4文本互信息選擇164
6.6.52統計量特征選擇165
6.6.6基于頻率的特征選擇方法166
6.7文本的索引構建167
6.7.1基于塊的排序索引方法167
6.7.2基于內存單次掃描的索引構建方法171
6.7.3順排文檔索引172
6.7.4倒排文檔索引178
本章小結186
本章思考與練習題187第7章圖像信息檢索189
7.1圖像基礎知識189
7.1.1圖像色彩三要素190
7.1.2圖像的三種基本類型192
7.1.3常用圖像文件格式192
7.2圖像檢索概述196
7.2.1圖像檢索一般模型196
7.2.2基于文本方式的圖像檢索197
7.2.3基于知識和視覺特征的圖像檢索198
7.2.4基于內容的圖像檢索198
7.2.5圖像內容描述的標準化 199
7.3基于圖像內容特征提取200
7.3.1基于顏色特征的圖像檢索200
7.3.2基于紋理特征的圖像檢索204
7.3.3基于形狀特征的圖像檢索206
7.3.4基于空間特征的圖像檢索214
7.3.5單個特征圖像檢索的不足215
7.4基于多特征的圖像檢索 216
7.4.1綜合顏色和形狀特征的圖像檢索216
7.4.2綜合形狀和空間特征的圖像檢索216
7.4.3綜合形狀和紋理特征的圖像檢索217
7.4.4綜合顏色、形狀和空間的圖像檢索217
7.5基于視覺特征的圖像檢索系統218
7.5.1基于視覺特征的圖像檢索系統整體架構218
7.5.2圖像分割技術219
7.5.3相似性度量224
7.5.4圖像索引226
7.5.5相關反饋技術232
7.6典型的圖像檢索系統233
7.7圖像檢索技術的發展方向234
7.7.1融合人工反饋 234
7.7.2高層語義和低層視覺特征結合234
7.7.3面向網絡圖像檢索235
7.7.4圖像檢索性能評價與檢索服務平臺235
本章小結236
本章思考與練習題237第8章音頻信息檢索239
8.1音頻的特點239
8.1.1音頻信息的基本特征239
8.1.2音頻信息的內容層次240
8.2音頻信息檢索技術的分類和發展241
8.2.1基于文本的音頻檢索241
8.2.2基于內容特征的音頻檢索243
8.3音頻信息檢索架構與模型244
8.3.1音頻信息檢索架構244
8.3.2向量空間模型借鑒245
8.3.3概率模型借鑒246
8.4表示級的音頻檢索247
8.4.1基于直接匹配的音頻樣例檢索247
8.4.2基于索引的音頻樣例檢索249
8.4.3基于GPU通用計算的音頻樣例快速檢索256
8.5語義級的語音文檔檢索263
8.5.1語音文檔檢索的預處理263
8.5.2語音文檔檢索的索引和搜索技術266
8.5.3語音文檔檢索中的容錯方法270
本章小結274
本章思考與練習題275第9章視頻信息檢索277
9.1數字視頻的相關基礎知識277
9.2基于內容的視頻檢索系統結構280
9.3視頻鏡頭分割281
9.3.1非壓縮域的鏡頭分割方法282
9.3.2壓縮域中鏡頭分割方法285
9.4鏡頭切換286
9.5關鍵幀提取及語義提取287
9.5.1關鍵幀提取的基本原理和準則287
9.5.2關鍵幀提取的方法287
9.5.3視頻語義提取290
9.6視頻特征提取291
9.6.1全局運動矢量的計算方法292
9.6.2視頻運動估計293
9.6.3運動矢量估計的常用算法296
9.7視頻聚類301
9.8視頻結構索引302
9.8.1視頻結構索引的機制303
9.8.2索引信息的存儲303
9.9視頻摘要305
9.10視頻語義檢索模型308
9.10.1底層特征提取模塊308
9.10.2底層特征向高層語義映射模塊 308
9.10.3視頻語義查詢模塊 310
9.10.4語義詞典的應用 311
9.11典型的視頻檢索系統311
本章小結312
本章思考與練習題314第10章Web信息搜索316
10.1搜索引擎概述316
10.1.1搜索引擎基本結構317
10.1.2傳統搜索引擎基本類型318
10.1.3智能搜索引擎基本類型319
10.2搜索引擎主要支撐技術324
10.2.1分詞技術324
10.2.2網絡蜘蛛325
10.2.3索引技術325
10.2.4詞頻相關指數326
10.2.5自動推理技術326
10.2.6本體知識系統327
10.2.7專家系統328
10.3Web采集329
10.3.1Web采集概述329
10.3.2采集器的功能與特點329
10.3.3Web采集330
10.3.4域名解析332
10.3.5待采集URL池335
10.3.6分布式索引336
10.3.7連接服務器339
10.3.8Web圖340
10.4主要網頁排序算法342
10.4.1PageRank 網頁排序算法343
10.4.2TopicSensitive PageRank算法343
10.4.3Hilltop算法344
10.4.4HITS算法345
10.4.5SALSA算法346
10.4.6BFS算法347
10.4.7PHITS算法347
本章小結348
本章思考與練習題349
第三部分信息檢索素養實踐應用篇
第11章
常用搜索引擎的檢索應用353
11.1百度搜索引擎的檢索應用353
11.2搜狗搜索引擎的信息檢索與利用372
11.3Google搜索引擎的檢索應用384
11.4Infoseek搜索引擎392
11.5雅虎搜索引擎信息檢索應用396
本章小結399
本章思考與練習題400第12章特種信息資源檢索401
12.1科技報告信息資源檢索401
12.1.1科技報告的概念與特征401
12.1.2科技報告的類型與編碼402
12.1.3國內科技報告與商業報告資源的信息檢索403
12.1.4國外科技報告資源檢索 409
12.2會議文獻資源檢索413
12.2.1會議文獻資源的概念413
12.2.2會議文獻的特點與類型414
12.2.3國外會議文獻的檢索415
12.2.4國內會議文獻的檢索419
12.3學位論文檢索423
12.3.1學位論文概述423
12.3.2國外重要學位論文數據庫檢索424
12.3.3重要國內學位論文數據庫檢索426
12.4專利文獻資源檢索434
12.4.1專利與專利文獻概念434
12.4.2專利文獻的類型與作用434
12.4.3國際專利分類436
12.4.4專利搜索引擎438
12.4.5國外大型專利數據庫系統445
12.4.6國內專利資源數據庫系統檢索455
12.5標準信息資源檢索462
12.5.1標準信息資源的概念與特點462
12.5.2標準信息資源的分類463
12.5.3美英等國標準信息資源檢索464
12.5.4中文標準信息資源檢索467
本章小結471
本章思考與練習題472第13章圖書與學術期刊論文信息資源檢索474
13.1大型中文圖書目錄檢索系統474
13.1.1中國國家圖書館聯機公共目錄查詢系統474
13.1.2CALIS聯合目錄公共檢索系統481
13.1.3北京大學圖書館公共查詢系統482
13.1.4清華大學圖書館館藏目錄檢索系統483
13.2典型中文數字圖書檢索超星數字圖書館486
13.3典型中文學術期刊論文檢索495
13.3.1CNKI中國學術期刊網檢索496
13.3.2維普中文科技期刊數據庫檢索499
13.4典型外文電子圖書檢索系統502
13.4.1CADAL外文圖書檢索502
13.4.2世界電子圖書館檢索502
13.4.3ebrary(電子圖書館)檢索504
13.4.4OCLC FirstSearch檢索506
13.4.5其他典型外文電子圖書檢索系統簡述508
13.5典型外文學術期刊檢索系統510
13.5.1Web of Science數據庫檢索510
13.5.2IEL數據庫檢索513
13.5.3EBSCO學術資源平臺檢索518
13.5.4Wiley在線圖書館檢索518
13.5.5其他典型期刊學術論文檢索系統520
本章小結525
本章思考與練習題526參考文獻527