Pour la même raison que pourquoi Dataproc offre à la fois Hadoop et de la bougie: parfois, un modèle de programmation est le meilleur ajustement pour le travail, parfois l'autre. De même, dans certains cas, la meilleure solution pour le travail, c'est l'Apache Faisceau modèle de programmation, offert par Flux de données.
Dans de nombreux cas, une considération importante est que l'on a déjà une base de code écrites en fonction d'un cadre particulier, et une seule veut déployer sur le Cloud Google, de sorte que même si, par exemple, la Poutre modèle de programmation est supérieure à Hadoop, quelqu'un avec beaucoup de Hadoop code peut toujours choisir Dataproc pour le moment, plutôt que de réécrire leur code sur la Poutre pour s'exécuter sur les Flux de données.
Les différences entre l'Étincelle et l'Faisceau modèles de programmation sont assez grandes, et il y a beaucoup de cas d'utilisation où chacun a un gros avantage sur les autres. Voir https://cloud.google.com/dataflow/blog/dataflow-beam-and-spark-comparison .