决策树C4.5算法属性取值优化研究
C4.5 of Decision Tree Algorithm Optimization of Property Values

作者: 黄世反 , 沈 勇 , 王瑞芳 , 马华丽 , 陈长赓 , 张宇昊 :云南大学软件学院,云南 昆明 ;

关键词: 决策树C4.5算法属性取值优化Decision Tree C4.5 Algorithm Property Values Optimization

摘要:
在决策树算法中,属性取值种类的多少决定着决策树分支数量的多少。基于此,提出了一种新的属性取值优化的方法,实例证明该方法确实能优化生成决策树的分支数量,达到精简生成决策树结构的目的,且该方法对原C4.5算法的分类正确率没有影响。

Abstract: About the decision tree algorithm, the quantity of the attribute value types determines the quantity of the decision tree branch. Based on this, we put forward a new method which can optimize attribute value. The examples show that the method can optimize the quantity of the decision tree branch, and reach the purpose that simplifies the decision tree structure. This method has no effect on the classification accuracy of the C4.5 algorithm.

文章引用: 黄世反 , 沈 勇 , 王瑞芳 , 马华丽 , 陈长赓 , 张宇昊 (2015) 决策树C4.5算法属性取值优化研究。 计算机科学与应用, 5, 171-178. doi: 10.12677/CSA.2015.55022

参考文献

[1] Quinlan, J.R. (1986) Induction of decision trees. Machine Learning, 1, 81-106.

[2] Quinlan, J.R. (1993) C4.5: Pro-grams for machine learning. Morgan Kaufmann, San Mateo.

[3] 黄爱辉 (2009) 决策树C4.5算法的改进及应用. 科学技术与工程, 1, 34-36.

[4] 刘鹏, 姚正, 尹俊杰 (2006) 一种有效的C4.5改进模型. 清华大学学报:自然科学版, 46, 996-1001.

[5] 李强 (2006) 创建决策树算法的比较研究-ID3, C4.5, C5.0算法的比较. 甘肃科学学报, 12, 84-87.

[6] 周琦 (2012) 改进的C4.5决策树算法研究及在高考成绩预测分析中的应用. 广西大学, 南宁.

分享
Top