2 votes

Comment sélectionner les colonnes qui existent dans les classes de cas à partir de DataFrame ?

Étant donné un DataFrame spark avec des colonnes "id", "first", "last", "year"

val df=sc.parallelize(Seq(
  (1, "John", "Doe", 1986),
  (2, "Ive", "Fish", 1990),
  (4, "John", "Wayne", 1995)
)).toDF("id", "first", "last", "year")

et la classe de cas

case class IdAndLastName(
id: Int,
last:String )

Je voudrais sélectionner uniquement les colonnes de la classe de cas qui sont id y last . En d'autres termes, j'aimerais avoir cette sortie df.select("id","last") en utilisant la classe de cas. J'évite de coder en dur les attributs. Pouvez-vous m'aider à réaliser cette opération de manière compacte ?

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X