J'ai un cadre de données pyspark qui ressemble à ceci :
df.show()
+---+
|dim|
+---+
|1x1|
|0x0|
|1x0|
+---+
Le type de données dans dim
es str
. Maintenant je veux séparer dim
en 2 colonnes, et avoir quelque chose comme ça :
df.show()
+---+----+----+
|dim|dim1|dim2|
+---+----+----+
|1x1| 1| 1|
|0x0| 0| 0|
|1x0| 1| 0|
+---+----+----+
Je sais que si je devais opérer sur une seule chaîne de caractères, j'utiliserais simplement la fonction split()
en python : "1x1".split("x")
Mais comment créer simultanément plusieurs colonnes à partir d'une colonne mappée par une fonction de fractionnement ?