J'ai une liste de mots avec des balises pos dans un fichier csv, chaque mot avec sa balise pos par exemple :
[(quoi,WP) (fait,VBZ) (ils,PRP) (font,VB) (il,PRP)] etc...
Je veux que les noeuds soient les TAG (WP,VBZ,PRP..) et les attributs les arêtes sous une forme consécutive ; par exemple la liste des arêtes sera :
[(quoi,fait) (fait, eux) (ils, font) (font, il)] il... Ainsi, je pourrais supprimer les noeuds dupliqués mais avoir encore tous les attributs sortant du noeud et entrant... J'ai ceci jusqu'à présent
G=nx.MultiGraph()
files = glob.glob('C:/Users/Sebastian/Desktop/prueba3/*.csv')
for path in files:
dirname, filename = os.path.split(path)
with open ('C:/Users/Sebastian/Desktop/prueba3/%s' %filename) as csvfile:
csv_reader = csv.reader(csvfile, delimiter=',')
for row in csv_reader:
new_node = row[1]
new_attributes = row[:1]
G.add_node(new_node, my_attributes=new_attributes)