我有 100 万条数据,每个数据是一个 200 维的向量,考虑对它们进行聚类。目前尝试了 scipy 的 k-means 聚类算法,但是半天没有结果。 计算平台是 windows 7,内存 16G。
1
xxxy 2019 年 8 月 15 日
有 gpu 的话可以用 tensorflow 的 k means,应该会快十几倍吧
|
2
ipwx 2019 年 8 月 15 日
|
3
pwrliang 2019 年 8 月 15 日 via Android
上分布式吧,用 Spark 写个 K-means
|
4
shidenggui 2019 年 8 月 15 日
pca 降维,再聚类
|
5
gazhang OP 最后还是在好点的机器上跑了,大概半小时。
|