Pyspark convertit RowMatrix en DataFrame ou RDD

Question

Pyspark convertit RowMatrix en DataFrame ou RDD

Demandé el 17 de Novembre, 2016: Quand la question a-t-elle été
964 affichage: Nombre de visites la question a
1 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

J'ai un square pyspark RowMatrix qui ressemble à ceci :

>>> row_mat.numRows()
100
>>> row_mat.numCols()
100
>>> row_mat.rows.first()
SparseVector(100, {0: 0.0, 1: 0.0018, 2: 0.1562, 3: 0.0342...})

Je voudrais courir pyspark.ml.feature.PCA mais son fit() ne prend en compte qu'un DataFrame . Existe-t-il un moyen de convertir cette RowMatrix en un DataFrame ?

Ou existe-t-il une meilleure façon de procéder ?

Demandé el 17 de Novembre, 2016 par Nigel Ng

Answer 1

1 Réponses

Answer 2

2voto

Utilisateur non enregistré Points 0

Úsalo:

row_mat.rows.map(lambda x: (x, )).toDF()

Répondu el 17 de Novembre, 2016 par Utilisateur non enregistré (0 Points )

Pyspark convertit RowMatrix en DataFrame ou RDD

Réponse

Questions en vedette

Top Tags

Prograide.com

Powered by:

Pyspark convertit RowMatrix en DataFrame ou RDD

Réponse

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: