基于粗糙集理论的属性约简算法和规则提取算法的设计和实现
当今社会是一个信息爆炸的世界,因此,一门新兴的的自动信息提取技术:数据挖掘和知识发现,应运而生并得到迅速发展。本人的毕业课题是基于粗糙集(Rough Set)理论的数据浓缩算法研究。
本人在一个学期的毕业课题设计中,对Pawlak Z.教授提出的经典Rough Set模型及其W. Ziarko教授提出的扩展模型—变精度β模型进行了一定的研究,并探讨了它们在数据挖掘中的应用。粗糙集模型把知识理解为划分,一个划分对应一个等价关系,对应一个商集。粗糙集模型在数据挖掘中具有广泛的适用性。变精度β模型是对概率模型的一种简化,它引入多数包含的概念,它通过参数β来调整个别特例所占地比例,摒弃个别特例的影响,使生成的规则更简化,当β=0时,β模型就是经典模型了。变精度β模型修正了经典模型的缺陷,保持了经典模型的有用性。但β模型也有自己的缺陷,即不具备依赖程度的单调性,这造成β模型在理论上和编程上的许多麻烦,所以单调性在属性约简中是很重要的。因此,本人提出了ε模型,该模型是基于最大交集最大概率的思想,对粗集理论的基本定义做了较大的改动,使之具有单调性,且也可摒弃个别特例的影响,通过调整参数ε的值(一般在0~0.5之间),可达到较好的约简结果,生成更为简化的规则。

您当前的位置:
