J'essaie de convertir des chaînes de date avec un fuseau horaire en timestamp en utilisant to_timestamp.
Exemple de cadre de données :
df = spark.createDataFrame([("a", '2020-09-08 14:00:00.917+02:00'),
("b", '2020-09-08 14:00:00.900+01:00')],
["Col1", "date_time"])
Ma tentative (avec le fuseau horaire Z) :
df = df.withColumn("timestamp",f.to_timestamp(df.date_time, "yyyy-MM-dd HH:mm:ss.SSSZ"))
df.select('timestamp').show()
Résultat réel :
+---------+
|timestamp|
+---------+
| null|
| null|
+---------+
Résultat souhaité (où l'horodatage est de type horodatage) :
+-------------------------+
| timestamp|
+-------------------------+
|2020-09-08 14:00:00+02:00|
|2020-09-08 14:00:00+01:00|
+-------------------------+
J'ai essayé de nombreuses autres versions du format, mais je n'arrive pas à trouver la bonne.