為保障軟件供應鏈安全和搶占全球創新制高點,一些國家政府和大型企業大力扶持開源軟件。開源軟件由于在開發時間、空間、人員和項目管理上的諸多特點而大大增加了開發的復雜性,進而使得開源軟件質量具有不確定性。針對這一問題,《數據驅動的開源軟件缺陷管理研究》*次聚焦于開源項目資源庫挖掘這一主題,展示如何利用大數據驅動方法支持開源軟件缺陷管理。《數據驅動的開源軟件缺陷管理研究》的內容包括開源軟件項目缺陷預測、開源軟件項目缺陷分配和開源軟件項目缺陷定位。在缺陷預測方面,針對軟件缺陷數據的非均衡性、多模態性、稀缺性和時間序列特性開展研究。在缺陷分配方面,針對開源軟件缺陷解決過程中的開發人員參與情況和開發人員專長開展研究。在缺陷定位方面,針對開源軟件缺陷修改牽涉面大而變更零散的特點開展研究。
目錄
第1章 開源軟件缺陷管理 1
1.1 研究背景 1
1.2 研究意義 2
1.3 研究綜述 3
1.4 內容結構 7
參考文獻 9
第2章 開源軟件項目缺陷預測 11
2.1 問題描述 11
2.2 基于統計抽樣的軟件缺陷預測 12
2.3 基于特征過濾的軟件缺陷預測 23
2.4 基于深度遷移學習的跨項目軟件缺陷預測 34
2.5 基于多模態時間序列的軟件缺陷數量分類研究 46
2.6 本章小結 54
參考文獻 55
第3章 開源軟件項目缺陷分配 58
3.1 基于缺陷相似度和開發者排名的開源軟件缺陷分配方法 58
3.2 基于主題模型的開源軟件缺陷分配方法 69
3.3 基于主題建模和異構網絡分析的開源軟件缺陷分配方法 77
3.4 本章小結 87
參考文獻 88
第4章 開源軟件項目缺陷定位 90
4.1 問題描述 90
4.2 基于缺陷修復歷史的兩階段缺陷定位方法 92
4.3 細粒度軟件缺陷定位方法 101
4.4 基于查詢擴展的方法體級別缺陷定位方法 114
4.5 本章小結 127
參考文獻 127
第5章 總結與展望 130
5.1 總結 130
5.2 展望 132
參考文獻 133