Utilisation explain
pour voir le plan physique est un bon moyen de déterminer la performance.
Par exemple, le carnet de notes Zeppelin Tutorial.
sqlContext.sql("select age, job from bank").filter("age = 30").explain
Et
sqlContext.sql("select age, job from bank where age = 30").explain
A exactement le même plan physique.
== Physical Plan ==
Project [age#5,job#6]
+- Filter (age#5 = 30)
+- Scan ExistingRDD[age#5,job#6,marital#7,education#8,balance#9]
La performance sera donc la même.
A travers je pense select age, job from bank where age = 30
est plus lisible dans ce cas.