Comptage des mots à l'aide de Spark Structured Streaming avec Python

Question

Comptage des mots à l'aide de Spark Structured Streaming avec Python

Demandé el 14 de Décembre, 2021: Quand la question a-t-elle été
48 affichage: Nombre de visites la question a
1 Réponses: Nombre de réponses aux questions
Ouvert: Situation réelle de la question

Je suis très novice en matière de Spark. Cet exemple est extrait du Structured Streaming Programming Guide de Spark :

from pyspark.sql import SparkSession
from pyspark.sql.functions import explode
from pyspark.sql.functions import split

spark = SparkSession \
            .builder \
            .appName("StructuredNetworkWordCount") \
            .getOrCreate()

# Create DataFrame representing the stream of input lines from connection to localhost:9999
       lines = spark \
         .readStream \
         .format("socket") \
         .option("host", "localhost") \
         .option("port", 9999) \
         .load()

# Split the lines into words
      words = lines.select(
        explode(
   split(lines.value, " ")
   ).alias("word")
   )

 # Generate running word count
     wordCounts = words.groupBy("word").count()

 # Start running the query that prints the running counts to the console
    query = wordCounts \
          .writeStream \
          .outputMode("complete") \
          .format("console") \
          .start()

query.awaitTermination()

J'ai besoin de modifier ce code pour compter les mots qui commencent par la lettre "B" et qui ont plus de 6 comptes. Comment puis-je le faire ?

Demandé el 14 de Décembre, 2021 par espartian

Answer 1

1 Réponses

Answer 2

0voto

espartian Points 35

La solution est la suivante :

wordCountsDF = wordsDF.groupBy('word').count().where('word.startsWith("B")' and 'count > 6')

Répondu el 16 de Décembre, 2021 par espartian (35 Points )

Comptage des mots à l'aide de Spark Structured Streaming avec Python

Réponse

Questions en vedette

Top Tags

Prograide.com

Powered by:

Comptage des mots à l'aide de Spark Structured Streaming avec Python

Réponse

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: