J'ai un square pyspark RowMatrix
qui ressemble à ceci :
>>> row_mat.numRows()
100
>>> row_mat.numCols()
100
>>> row_mat.rows.first()
SparseVector(100, {0: 0.0, 1: 0.0018, 2: 0.1562, 3: 0.0342...})
Je voudrais courir pyspark.ml.feature.PCA
mais son fit()
ne prend en compte qu'un DataFrame
. Existe-t-il un moyen de convertir cette RowMatrix
en un DataFrame
?
Ou existe-t-il une meilleure façon de procéder ?