基于欠采樣和多層集成學習的惡意網(wǎng)頁識別
計算機工程與設(shè)計
頁數(shù): 7 2024-03-16
摘要: 現(xiàn)實中惡意網(wǎng)頁與良性網(wǎng)頁比重嚴重失衡,傳統(tǒng)的機器學習分類模型不能很好的應用,為此提出一種基于欠采樣和多層集成學習的惡意網(wǎng)頁檢測模型。通過欠采樣達到局部數(shù)據(jù)平衡;通過第一層基于權(quán)重和閾值的集成學習確保模型的準確度;通過第二層基于投票的集成學習保證全局信息的完整性。實驗結(jié)果表明,所提模型在不平衡數(shù)據(jù)集上的惡意網(wǎng)頁識別性能優(yōu)于傳統(tǒng)機器學習模型。 (共7頁)