5 votes

PySpark : TypeError : L'objet 'str' n'est pas appelable dans les opérations sur les cadres de données.

Je lis les fichiers d'un dossier dans une boucle et je crée des cadres de données à partir de ceux-ci. Cependant, j'obtiens cette erreur bizarre TypeError: 'str' object is not callable . Veuillez trouver le code ici :

for yr in range (2014,2018):
  cat_bank_yr = sqlCtx.read.csv(cat_bank_path+str(yr)+'_'+h1+'bank.csv000',sep='|',schema=schema)
  cat_bank_yr=cat_bank_yr.withColumn("cat_ledger",trim(lower(col("cat_ledger"))))
  cat_bank_yr=cat_bank_yr.withColumn("category",trim(lower(col("category"))))

Le code s'exécute pendant une itération puis s'arrête à la ligne

cat_bank_yr=cat_bank_yr.withColumn("cat_ledger",trim(lower(col("cat_ledger")))) 

avec l'erreur ci-dessus.

Quelqu'un peut-il nous aider ?

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X