J'ai besoin de diviser sd_phonenumber sur la base de ".", j'ai besoin de deux colonnes :
sd_phone| phone|sd_phonenumber|
+--------+---------------+--------------+
| 1| 44 7723 466844| 44.7723466844|
| | 646-821-1444| 6468211444|
| | 405-455-5941| 4054555941|
| 1|886-4-2359-5958| 88.6423595958|
| 1|+1 973-340-9100| 1.9733409100|
| | 046-23 45 50| null|
| | 559-374-2385| 5593742385|
| | +507 395 3560| 5073953560|
| | 650-727-4950| 6507274950|
Par exemple : 44.7723466844
col1 col2
44 7723466844
Jusqu'à présent, j'ai essayé :
df_phone_cc=df_phone.with column("sd_phone", split(col("sd_phonenumber"), ".").getItem(0))
df_phone_cc=df_phone.withColumn("sd_phone" ,split_col.getItem(1))
J'obtiens null pour l'ensemble des colonnes sd_phone. Est-ce que quelqu'un peut m'aider ?