发布网友 发布时间:2022-04-22 03:26
共2个回答
热心网友 时间:2023-05-21 01:02
一个是有规则进行,一个是无规则进行。分类是根据规则进行的,可以根据新的已有类别数据修正分类规则,不断提高其分类准确性。聚类是纯粹的根据已有数据进行系统把数据聚类,有可能聚类出来的没有实际意义。
分类是数据挖掘中的一项非常重要的任务,从机器学习的观点,分类技术是一种有指导的学习,即每个训练样本的数据对象已经有类标识,通过学习可以形成表达数据对象与类标识间对应的知识。从这个意义上说,数据挖掘的目标就是根据样本数据形成的类知识并对源数据进行分类,进而也可以预测未来数据的归类。与分类技术不同,在机器学习中,聚类是一种无指导学习。聚类是在预先不知道欲划分类的情况下,根据信息相似度原则进行信息聚类的一种方法。聚类的目的是使得属于同类别的对象之间的差别尽可能的小,而不同类别上的对象的差别尽可能的大。通过聚类,人们能够识别密集的和稀疏的区域,因而发现全局的分布模式,以及数据属性之间的有趣的关系。
想更多了解数据分类与聚类区别,推荐上CDA数据分析师的课程。课程内容兼顾培养解决数据挖掘流程问题的横向能力以及解决数据挖掘算法问题的纵向能力。要求学生具备从数据治理根源出发的思维,通过数字化工作方法来探查业务问题,通过近因分析、宏观根因分析等手段,再选择业务流程优化工具还是算法工具,而非“遇到问题调算法包”。真正理解商业思维,项目思维,能够遇到问题解决问题。点击预约免费试听课
热心网友 时间:2023-05-21 01:03
分类是根据规则进行的,你把这个规则建立起来後还可以运用到其他尚未分类的数据,同时还可以根据新的已有类别数据修正分类规则,不断提高其分类准确性
聚类是纯粹的根据已有数据进行系统把数据聚类,有可能聚类出来的没有实际意义,聚类也无法通过训练数据和后期的数据不断提高准确度的