3 votes

lecture d'une date dans un cadre de données sur la base de conditions dans un cadre de données différent

J'ai 2 cadres de données. J'ai besoin de lire les valeurs d'un cadre de données en fonction des valeurs d'un autre cadre de données.

mots :

words = pd.DataFrame()
words['no'] = [1,2,3,4,5,6,7,8,9]
words['word'] = ['cat', 'in', 'hat', 'the', 'dog', 'in', 'love', '!', '<3']
words

Des phrases :

sentences =  pd.DataFrame()
sentences['no'] =[1,2,3]
sentences['start'] = [1, 4, 6]
sentences['stop'] = [3, 5, 9]
sentences

la sortie souhaitée est dans un fichier texte :

cat in hat
***
the dog
***
in love ! <3

Cependant, je n'arrive pas à passer cette étape, j'ai essayé d'exécuter le code suivant :

pour x dans les phrases : print(words['word'][words['no'].between(sentences['start'], sentences['stop'], inclusive = True)

mais je suis renvoyé avec cette erreur

 File "<ipython-input-16-ae3f5333be66>", line 3
    print(words['word'][words['no'].between(sentences['start'], sentences['stop'], inclusive = True)
                                                                                                    ^
SyntaxError: unexpected EOF while parsing

2voto

coldspeed Points 111053

Définir no comme indice pour words et ensuite itérer sur sentences en utilisant une liste de compréhension :

v = words.set_index('no')['word']
sentences = [
    ' '.join(v.loc[i:j]) for i, j in zip(sentences['start'], sentences['stop'])
]

Ou indice agnostique :

v = words['word'].tolist()
sentences = [
    ' '.join(v[i - 1:j - 1] for i, j in zip(sentences['start'], sentences['stop'])
]

['cat in hat', 'the dog', 'in love ! <3']

L'enregistrement dans un fichier devrait être simple à partir de là :

with open('file.txt', 'w') as f:
    for sent in sentences:
        f.write(sent + '\n')
        f.write('***\n')

1voto

Mohamed Thasin ah Points 2545

Une façon de résoudre ce problème,

res=pd.DataFrame()
res['s']=sentences.apply(lambda x: ' '.join(words.iloc[(x['start']-1):(x['stop'])]['word']),axis=1)
res.to_csv('a.txt',index=False,header=False,line_terminator='\n***\n')

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X