当前位置：首页 » 数据智能 » 大数据的聚类

大数据的聚类

发布时间: 2021-03-24 11:30:46

⑴ 聚类分析能不能对大数据进行分类

可以
聚类分析本身也被列到属于数据挖掘的一种方法，是属于无监督学习的类型

⑵ 大数据量聚类 Kmeans 出问题怎么办

数据量太大的时候来不适自合用系统聚类法一个就是你遇到的问题无法判断，另一个就是该方法聚类的结果不是一种情况，你可以根据自己的专业进行适当的选择归类，比较有难度如果你的变量类型都是连续性的数据可以直接采用k-mean法指定聚类的类别进行如果你的变量类型既有分类又有连续性的，则采用两阶段法聚类，这种方法会自动推荐出聚类的个数，而且应用非常广泛，结果直观

⑶ 大数据进行kmeans聚类在hadoop2上怎么实现

map中根据选定的聚类点对整体数据进行分簇，rece中找出一个簇中的中心点，就完成了kmeans的类聚

⑷ 在大数据量时,K-means算法和层次聚类算法谁更有优势为什么

这个抄问题其实是无解的，数据不同，算法的分类效果、实际运行时间也是不同。
若单从运算速度而言，k-means比层次更快。
原因是K-means是找中心，然后计算距离；层次是逐个样本逐层合并，层次的算法复杂度更高。
更重要的是，在大数量下，K-means算法和层次聚类算法的分类效果真的只能用见仁见智来形容了。

⑸ 大数据的获取是怎样的，老师让我做一个大数据的聚类分析，我没什么头绪，请指教，谢谢~

你可以对2013-1014全国各城市人均GDP排名来个分析，具体数据就放在附件了，分析一下发展趋势等等。希望对你有用。

⑹ 在大数据量时，K-means算法和层次聚类算法谁更有优势

这个问题其实是无解的，数据不同，算法的分类效果、实际运行时间也是不同。
若单从运算速度而言，k-means比层次更快。
原因是K-means是找中心，然后计算距离；层次是逐个样本逐层合并，层次的算法复杂度更高。
更重要的是，在大数量下，K-means算法和层次聚类算法的分类效果真的只能用见仁见智来形容了。

⑺ k-means聚类可用于大数据挖掘吗

聚类分析作为数据挖掘技术中的一种分析工具，近几十年来一直受到广泛的关注，并且已在数据挖掘、图像分割、模式识别、信息检索、计算机视觉等诸多方面有广泛的应用和研究。

⑻ 如何对大数据聚类分析

不是有很多的模型吗？python里面封装了很多方法，聚类的话有经典的k-mean方法。可以直接使用，然后分析即可。你要是有数据的话，我这边可以给你分析一下

⑼ 什么样的大数据集适合聚类分类分析

聚类分析的主要应用：

商业

聚类分析被用来发现不同的客户群，并且通过购买模式刻画不同的客户群的特征。聚类分析是细分市场的有效工具，同时也可用于研究消费者行为，寻找新的潜在市场、选择实验的市场，并作为多元分析的预处理。

生物

聚类分析被用来动植物分类和对基因进行分类，获取对种群固有结构的认识

地理

聚类能够帮助在地球中被观察的数据库商趋于的相似性

保险行业

聚类分析通过一个高的平均消费来鉴定汽车保险单持有者的分组，同时根据住宅类型，价值，地理位置来鉴定一个城市的房产分组

因特网

聚类分析被用来在网上进行文档归类来修复信息

电子商务

聚类分析在电子商务中网站建设数据挖掘中也是很重要的一个方面，通过分组聚类出具有相似浏览行为的客户，并分析客户的共同特征，可以更好的帮助电子商务的用户了解自己的客户，向客户提供更合适的服务。

⑽ 用于数据挖掘的聚类算法有哪些，各有何优势

K均值聚类：最适合处理大数据，适用于大样本的个案聚类，分类数明确，适用于连续性变量；
系统聚类：适用于个案或变量聚类，对分类数没有要求，连续性和分类型变量均适用；
两步聚类：1）分类变量和连续变量均可参与二阶聚类；2）可自动确定分类数；3）适用于大数据集；4）用户可自己定制用于运算的内存容量

阅读全文

大数据的聚类

与大数据的聚类相关的阅读推荐