Étant donné un DataFrame spark avec des colonnes "id", "first", "last", "year"
val df=sc.parallelize(Seq(
(1, "John", "Doe", 1986),
(2, "Ive", "Fish", 1990),
(4, "John", "Wayne", 1995)
)).toDF("id", "first", "last", "year")
et la classe de cas
case class IdAndLastName(
id: Int,
last:String )
Je voudrais sélectionner uniquement les colonnes de la classe de cas qui sont id
y last
. En d'autres termes, j'aimerais avoir cette sortie df.select("id","last")
en utilisant la classe de cas. J'évite de coder en dur les attributs. Pouvez-vous m'aider à réaliser cette opération de manière compacte ?