J'ai déjà des données anciennes stockées en parquet avec un schéma représenté par
case class A(name: String)
J'aimerais ajouter un nouveau champ non obligatoire dans la rubrique
case class B(name: String, age: Option[Int])
et lire les anciennes et les nouvelles données dans le même fichier. DataFrame
. A chaque fois que j'essaie de lire les données avec spark.read.parquet("test_path").as[B].collect()
J'obtiens l'exception suivante :
Exception dans le thread "main" org.apache.spark.sql.AnalysisException : cannot resolve '``age`' given input columns : [name] ;
Existe-t-il un moyen de spécifier un schéma rétrocompatible pour toutes mes données ?