本書基于“基礎知識” +“代碼示例” +“應用案例”的模式編寫,共包括 7個項目。項目 1主要介紹互聯網數據采集的入門知識;項目 2通過一個入門級的簡單案例,介紹互聯網數據采集的基本流程;項目 3通過一個進階的案例,詳細介紹在沒有給出官方開放 API的情況下,如何通過抓包工具獲取 XHR請求地址;項目 4主要介紹 HTML文檔數據的采集,對 HTML進行解析,以及如何提取數據的屬性與文本;項目 5主要講解批量獲取數據的整理與合并技巧;項目 6重點講解如何通過 Python的 pymysql庫對 MySQL進行讀寫;項目 7給出了對半結構化數據進行處理的**實踐。 本書內容條理清晰、案例豐富,可以作為職業院校大數據、人工智能、云計算等相關專業的教材,也可以作為行業從業人員的參考用書。
本書封面貼有清華大學出版社防偽標簽,無標簽者不得銷售。