我有功能 (X,Y)= transform_text(read_dataset(“ SMsspamCollection”))
{for x,y in zip(*X.nonzero()):
print("[%d][%d] = %s" % (x,y,X[x,y]))
}
,我想使用Agglomerativeclustering 而且我用了这个,但是对大文件没用。
def hyrarchique():
array=[]
(X,Y)=transform_text(read_dataset("tmp.txt"))
for x,y in zip(*X.nonzero()):
array.append([x,y])
clustering = Agglomerativeclustering().fit(array)
print(clustering.labels_)