J'ai deux DataFrames pandas et je veux mettre à jour l'une avec l'autre... Mais je ne peux pas être sûr que les index correspondent. (c'est donc un problème d'utiliser DataFrame.update !)
exemple :
import pandas as pd
df1 = pd.DataFrame([('path1', 0, 0, 0),
('path2', 0, 0, 0),
('path3', 0, 0, 0),
('path4', 0, 0, 0),],
columns=['path', 'class', 'manual', 'conf'],
index = [1,2,3,4])
df2 = pd.DataFrame([('path1', 1, 0, 0),
('path2', 0, 1, 0),
('path3', 0, 0, 1),
('path5', 1, 1, 0),
('path6', 1, 1, 0),],
columns=['path', 'class', 'manual', 'conf'],
index = [10,11,12,13,14])
Le résultat souhaité :
update_annotations(df1, df2)
path class manual conf
1 path1 1 0 0
2 path2 0 1 0
3 path3 0 0 1
4 path4 0 0 0
df1.update(df2) peut être risqué, car les index de ces données peuvent ne pas correspondre. quelle est la manière la plus sûre et la plus efficace de procéder ?