Je veux sauvegarder RDD
en tant que fichier parquet. Pour ce faire, je passe RDD à DataFrame
puis j'utilise une structure pour sauvegarder DataFrame
en tant que fichier parquet :
val aStruct = new StructType(Array(StructField("id",StringType,nullable = true),
StructField("role",StringType,nullable = true)))
val newDF = sqlContext.createDataFrame(filtered, aStruct)
La question est comment créer aStruct
automatiquement pour toutes les colonnes en supposant qu'elles sont toutes de type StringType
? De plus, que signifie nullable = true
? Est-ce que cela signifie que toutes les valeurs vides seront substituées par Null
?