L'objet flottant n'a pas d'attribut 'split' en python

Question

L'objet flottant n'a pas d'attribut 'split' en python

Demandé el 30 de Décembre, 2022: Quand la question a-t-elle été
77 affichage: Nombre de visites la question a
2 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

Je suis novice en Python. J'ai ce code Python pour séparer les colonnes d'un tableau csv :

import pandas as pd
import re

df = pd.read_csv("test.csv")

# obtenir les données de traffic
name_regex = r"(?<=(\'name\': ))[^,]*(?=,)"
medium_regex = r"(?<=(\'medium\': ))[^,]*(?=,)"
source_regex = r"(?<=(\'source\': ))[^,]*(?=})"

def get_name(x):
    return [re.search(name_regex, line).group().replace("'", "") for line in x.split("\n")]
def get_medium(x):
    return [re.search(medium_regex, line).group().replace("'", "") for line in x.split("\n")]
def get_source(x):
    return [re.search(source_regex, line).group().replace("'", "") for line in x.split("\n")]

df["traffic_name"] = df["traffic"].apply(get_name)
df["traffic_medium"] = df["traffic"].apply(get_medium)
df["traffic_source"] = df["traffic"].apply(get_source)
del df["traffic"]

final_df = df.explode(["traffic_name", "traffic_medium", "traffic_source"])

print(final_df)

final_df.to_csv("traffic.csv")

voici mes données csv :

,traffic_source
0,"{'name': '(test1)', 'medium': '(no1)', 'source': '(yes)'}"
1,
2,"{'name': '(test1)', 'medium': 'no2', 'source': 'yes1'}"
3,
4,"{'name': '(test2)', 'medium': 'no3', 'source': 'yes'}"

lorsque j'exécute le code python, il y a une erreur. Pouvez-vous s'il vous plaît aider ? Merci

~\AppData\Local\Temp\ipykernel_15228\2852501840.py in get_name(x)
     12 
     13 def get_name(x):
---> 14     return [re.search(name_regex, line).group().replace("'", "") for line in x.split("\n")]
     15 def get_medium(x):
     16     return [re.search(medium_regex, line).group().replace("'", "") for line in x.split("\n")]

AttributeError: 'float' object has no attribute 'split'

Demandé el 30 de Décembre, 2022 par Phh

Answer 1

2 Réponses

Answer 2

1voto

Soviut Points 26384

La première colonne de votre fichier CSV est un nombre (traité comme un flottant). Les nombres ne peuvent pas être divisés.

De plus, vos données CSV semblent stocker du JSON dans la deuxième colonne. Au lieu d'écrire des expressions régulières, décodez simplement la chaîne en utilisant la bibliothèque json.

Répondu el 30 de Décembre, 2022 par Soviut (26384 Points )

Answer 3

1voto

Niyaz Points 362

Cette erreur se produit parce que Pandas traite les première et troisième lignes de la colonne traffic (il n'y a pas de valeur, ce qui signifie nan) comme un float, vous pouvez supprimer les lignes float en utilisant :

df=df[df['traffic'].apply(lambda x: isinstance(x, str))]

Solution complète :

import pandas as pd
from io import StringIO
import re

#I use this to regenerate your CSV
CSV=StringIO("""
,traffic
0,"{'name': '(test1)', 'medium': '(no1)', 'source': '(yes)'}"
1,
2,"{'name': '(test1)', 'medium': 'no2', 'source': 'yes1'}"
3,
4,"{'name': '(test2)', 'medium': 'no3', 'source': 'yes'}"
""")

df = pd.read_csv(CSV, sep=",")

name_regex = r"(?<=('name': ))[^,]*(?=,)"
medium_regex = r"(?<=('medium': ))[^,]*(?=,)"
source_regex = r"(?<=('source': ))[^,]*(=})"

def get_name(x):
  return [re.search(name_regex, line).group().replace("'", "") for line in x.split("\n")]
def get_medium(x):
  return [re.search(medium_regex, line).group().replace("'", "") for line in x.split("\n")]
def get_source(x):
  return [re.search(source_regex, line).group().replace("'", "") for line in x.split("\n")]

df=df[df['traffic'].apply(lambda x: isinstance(x, str))] 

df["traffic_name"] =   df["traffic"].apply(get_name)
df["traffic_medium"] = df["traffic"].apply(get_medium)
df["traffic_source"] = df["traffic"].apply(get_source)
del df["traffic"]

final_df = df.explode(["traffic_name", "traffic_medium", "traffic_source"])

print(final_df)

final_df.to_csv("traffic.csv")

Répondu el 30 de Décembre, 2022 par Niyaz (362 Points )

L'objet flottant n'a pas d'attribut 'split' en python

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

L'objet flottant n'a pas d'attribut 'split' en python

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: