隨著數據存儲技術、網絡技術和云計算技術的快速發展, 數據正以前所未有的速度在不斷地增長和積累。在各種實際應用中, 需要處理的數據量越來越大。 而樣例選擇就是從包括冗余或噪聲的海量數據中選擇重要數據的技術, 是機器學習的重要數據預處理步驟, 對后續學習算法的訓練及性能有很大的影響. 在機器學習中, 樣例選擇有兩種場景:一是主動學習場景, 二是監督學習場景. 本書結合作者及研究團隊近年來關于樣例選擇的研究成果, 系統介紹了兩種場景下樣例選擇的理論和方法以及兩種場景下樣例選擇之間的區別與聯系。另外,本書內容涵還蓋了樣例選擇的最新研究進展。
翟俊海
----------------------------
翟俊海:河北大學教授,博士生導師,河北省機器學習與計算智能重點實驗室主任,河北省機器學習學會理事長,河北省高校大數據教育聯盟專家委員會委員,河北大學學術委員會委員。中國人工智能學會知識工程與分布智能專業委員會委員、粒計算與知識發現專業委員會委員。主要研究方向為大數據處理、機器學習、深度學習。近5年主持和主研國家和省部級科研項目7項。發表學術論文70余篇,其中SCI檢索17篇,ESI高被引論文2篇。獲河北省自然科學三等獎1項(排名第2)。
第1章 機器學習基礎
第2章 主動學習中的樣例選擇
第3章 監督學習中的樣例選擇
第4章 大數據樣例選擇
第5章 模糊樣例選擇