J'essaie de supprimer les mots d'arrêt de la collection de mots d'arrêt de NLTK à partir d'un DataFrame pandas constitué de lignes de données textuelles en Python 3 :
import pandas as pd
from nltk.corpus import stopwords
file_path = '/users/rashid/desktop/webtext.csv'
doc = pd.read_csv(file_path, encoding = "ISO-8859-1")
texts = doc['text']
filter = texts != ""
dfNew = texts[filter]
stop = stopwords.words('english')
dfNew.apply(lambda x: ' '.join([word for word in x.split() if word not in (stop)]))
Je reçois cette erreur :
'float' object has no attribute 'split'