Comment fusionner des dictionnaires de dictionnaires ?

Question

Comment fusionner des dictionnaires de dictionnaires ?

Demandé el 26 de Août, 2011: Quand la question a-t-elle été
128575 affichage: Nombre de visites la question a
5 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

J'ai besoin de fusionner plusieurs dictionnaires, voici ce que j'ai par exemple :

dict1 = {1:{"a":{A}}, 2:{"b":{B}}}

dict2 = {2:{"c":{C}}, 3:{"d":{D}}}

Avec A B C et D étant des feuilles de l'arbre, comme {"info1":"value", "info2":"value2"}

Il existe un niveau inconnu de dictionnaires, il pourrait s'agir de {2:{"c":{"z":{"y":{C}}}}}

Dans mon cas, il représente une structure de répertoires/fichiers dont les nœuds sont des documents et les feuilles des fichiers.

Je souhaite les fusionner pour obtenir :

 dict3 = {1:{"a":{A}}, 2:{"b":{B},"c":{C}}, 3:{"d":{D}}}

Je ne sais pas comment je pourrais faire cela facilement avec Python.

Demandé el 26 de Août, 2011 par Hydex

Answer 1

5 Réponses

Answer 2

3voto

andsens Points 910

Il y a un petit problème avec la réponse d'Andrew Cooke : Dans certains cas, elle modifie le deuxième argument b lorsque vous modifiez le dict retourné. C'est en particulier à cause de cette ligne :

if key in a:
    ...
else:
    a[key] = b[key]

If b[key] est un dict il sera simplement assigné à a , c'est-à-dire toute modification ultérieure de cette dict affectera à la fois a et b .

a={}
b={'1':{'2':'b'}}
c={'1':{'3':'c'}}
merge(merge(a,b), c) # {'1': {'3': 'c', '2': 'b'}}
a # {'1': {'3': 'c', '2': 'b'}} (as expected)
b # {'1': {'3': 'c', '2': 'b'}} <----
c # {'1': {'3': 'c'}} (unmodified)

Pour remédier à ce problème, il faudrait remplacer la ligne par celle-ci :

if isinstance(b[key], dict):
    a[key] = clone_dict(b[key])
else:
    a[key] = b[key]

Où clone_dict est :

def clone_dict(obj):
    clone = {}
    for key, value in obj.iteritems():
        if isinstance(value, dict):
            clone[key] = clone_dict(value)
        else:
            clone[key] = value
    return

Toujours. Cela ne tient évidemment pas compte list , set et d'autres choses, mais j'espère que cela illustre les pièges qui se présentent lorsque l'on essaie de fusionner des dicts .

Et pour être complet, voici ma version, où vous pouvez le faire passer plusieurs fois. dicts :

def merge_dicts(*args):
    def clone_dict(obj):
        clone = {}
        for key, value in obj.iteritems():
            if isinstance(value, dict):
                clone[key] = clone_dict(value)
            else:
                clone[key] = value
        return

    def merge(a, b, path=[]):
        for key in b:
            if key in a:
                if isinstance(a[key], dict) and isinstance(b[key], dict):
                    merge(a[key], b[key], path + [str(key)])
                elif a[key] == b[key]:
                    pass
                else:
                    raise Exception('Conflict at `{path}\''.format(path='.'.join(path + [str(key)])))
            else:
                if isinstance(b[key], dict):
                    a[key] = clone_dict(b[key])
                else:
                    a[key] = b[key]
        return a
    return reduce(merge, args, {})

Répondu el 20 de Décembre, 2014 par andsens (910 Points )

Answer 3

3voto

user15964 Points 346

Vous pouvez utiliser le merge de la fonction toolz par exemple :

>>> import toolz
>>> dict1 = {1: {'a': 'A'}, 2: {'b': 'B'}}
>>> dict2 = {2: {'c': 'C'}, 3: {'d': 'D'}}
>>> toolz.merge_with(toolz.merge, dict1, dict2)
{1: {'a': 'A'}, 2: {'c': 'C'}, 3: {'d': 'D'}}

Répondu el 22 de Janvier, 2020 par user15964 (346 Points )

Answer 4

2voto

blakev Points 692

T

I

def merge_dicts(*dicts):
    if not reduce(lambda x, y: isinstance(y, dict) and x, dicts, True):
        raise TypeError, "Object in *dicts not of type dict"
    if len(dicts) < 2:
        raise ValueError, "Requires 2 or more dict objects"

    def merge(a, b):
        for d in set(a.keys()).union(b.keys()):
            if d in a and d in b:
                if type(a[d]) == type(b[d]):
                    if not isinstance(a[d], dict):
                        ret = list({a[d], b[d]})
                        if len(ret) == 1: ret = ret[0]
                        yield (d, sorted(ret))
                    else:
                        yield (d, dict(merge(a[d], b[d])))
                else:
                    raise TypeError, "Conflicting key:value type assignment"
            elif d in a:
                yield (d, a[d])
            elif d in b:
                yield (d, b[d])
            else:
                raise KeyError

    return reduce(lambda x, y: dict(merge(x, y)), dicts[1:], dicts[0])

print merge_dicts({1:1,2:{1:2}},{1:2,2:{3:1}},{4:4})

o

Répondu el 24 de Août, 2013 par blakev (692 Points )

Answer 5

2voto

Guy Gangemi Points 521

Étant donné que les dictviews prennent en charge les opérations sur les ensembles, j'ai pu simplifier considérablement la réponse de jterrace.

def merge(dict1, dict2):
    for k in dict1.keys() - dict2.keys():
        yield (k, dict1[k])

    for k in dict2.keys() - dict1.keys():
        yield (k, dict2[k])

    for k in dict1.keys() & dict2.keys():
        yield (k, dict(merge(dict1[k], dict2[k])))

Toute tentative de combinaison d'un dict avec un non-dict (techniquement, un objet avec une méthode "keys" et un objet sans méthode "keys") soulèvera une AttributeError. Cela inclut à la fois l'appel initial à la fonction et les appels récursifs. C'est exactement ce que je voulais, donc je l'ai laissé. Vous pourriez facilement attraper une AttributeError levée par l'appel récursif et donner ensuite la valeur que vous voulez.

Répondu el 10 de Février, 2016 par Guy Gangemi (521 Points )

Answer 6

2voto

Hans Bouwmeester Points 60

En bref en douceur :

from collections.abc import MutableMapping as Map

def nested_update(d, v):
    """
    Nested update of dict-like 'd' with dict-like 'v'.
    """

    for key in v:
        if key in d and isinstance(d[key], Map) and isinstance(v[key], Map):
            nested_update(d[key], v[key])
        else:
            d[key] = v[key]

Cela fonctionne comme (et s'appuie sur) la fonction Python dict.update méthode. Elle renvoie None (vous pouvez toujours ajouter return d si vous préférez) au fur et à mesure qu'il met à jour la dictée d en place. Clés en v écrasera toutes les clés existantes dans d (il n'essaie pas d'interpréter le contenu du dict).

Il fonctionnera également pour d'autres correspondances ("dict-like").

Ejemplo:

people = {'pete': {'gender': 'male'}, 'mary': {'age': 34}}
nested_update(people, {'pete': {'age': 41}})

# Pete's age was merged in
print(people)
{'pete': {'gender': 'male', 'age': 41}, 'mary': {'age': 34}}

Là où Python est régulier dict.update permet d'obtenir des résultats :

people = {'pete': {'gender': 'male'}, 'mary': {'age': 34}}
people.update({'pete': {'age': 41}})

# We lost Pete's gender here!
print(people) 
{'pete': {'age': 41}, 'mary': {'age': 34}}

Répondu el 13 de Septembre, 2018 par Hans Bouwmeester (60 Points )

Comment fusionner des dictionnaires de dictionnaires ?

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

Comment fusionner des dictionnaires de dictionnaires ?

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: