Apache Faisceau prend en charge plusieurs runner backends, y compris Apache Spark et Flink. Je suis familier avec Spark/Flink et je suis en train de voir les avantages/inconvénients de Faisceau pour le traitement par lot.
Regarder le Faisceau word count exemple, il sent qu'il est très similaire à la maternelle Spark/Flink équivalents, peut-être avec un peu plus détaillée de la syntaxe.
Actuellement, je ne vois pas un grand avantage de choisir Faisceau sur Spark/Flink pour une telle tâche. Les seules observations que je peux faire pour l'instant:
- Pro: Abstraction au-dessus d'exécution différents backends.
- Con: Cette abstraction se fait au prix d'avoir moins de contrôle sur ce qui est exactement exécuté dans Spark/Flink.
Existe t il de meilleurs exemples qui mettent en évidence d'autres avantages/inconvénients de la Poutre modèle? Est-il des informations sur la façon de la perte de contrôle sur les performances?
Notez que je ne demande pas de différences dans le streaming aspects, qui sont en partie couvertes dans cette question et résumées dans cet article (obsolète en raison de l'Étincelle 1.X).