J'utilise pandas pour récupérer un site web, mais il renvoie une colonne entière avec le nom de l'utilisateur. 'nan'
au lieu des valeurs appropriées. J'ai essayé de modifier plusieurs read_html()
paramètres, tels que la saveur, les convertisseurs et les valeurs na_, sans succès. J'ai remarqué que le code html de la colonne troublée diffère en ce sens que les autres sont 'td class='
tandis que celui qui n'est pas lu correctement lit 'td data-behavior='
. Lorsque je copie/colle simplement le tableau dans Excel, tout est collé correctement. Je vous serais reconnaissant de bien vouloir m'aider.
J'ai essayé de changer certains paramètres sur read_html()
sans succès. J'ai également essayé d'obtenir la table en utilisant lxml/xpath et je n'ai pas réussi non plus.
week_data = pd.read_html('https://www.espn.co.uk/nfl/fixtures/_/week/2/seasontype/1',
converters={'time': str})
La colonne doit comporter des chaînes de caractères contenant l'heure du match.