基于改進(jìn)決策樹(shù)的不平衡數(shù)據(jù)集分類(lèi)算法研究
計(jì)算機(jī)仿真
頁(yè)數(shù): 5 2024-08-15
摘要: 不平衡數(shù)據(jù)集中各類(lèi)樣本數(shù)量不均,導(dǎo)致分類(lèi)模型難以訓(xùn)練。針對(duì)不平衡數(shù)據(jù)分類(lèi)模型穩(wěn)定性差,準(zhǔn)確率低的問(wèn)題,提出一種基于改進(jìn)C4.5決策樹(shù)數(shù)據(jù)分類(lèi)算法,通過(guò)融合SMOTE優(yōu)化采樣算法,構(gòu)建出N_C4.5-IDC不平衡數(shù)據(jù)分類(lèi)模型。模型首先利用K-Means聚類(lèi)對(duì)數(shù)據(jù)集進(jìn)行狀態(tài)分布分析,并使用SMOTE采樣法進(jìn)行混合采樣,通過(guò)增加人為樣本點(diǎn)提高少數(shù)類(lèi)樣本數(shù),對(duì)數(shù)據(jù)集進(jìn)行平衡處理;然后對(duì)... (共5頁(yè))