Une version pondérée de random.choice

Question

Une version pondérée de random.choice

Demandé el 9 de Septembre, 2010: Quand la question a-t-elle été
9924 affichage: Nombre de visites la question a
5 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

J'avais besoin d'écrire une version pondérée de random.choice (chaque élément de la liste a une probabilité différente d'être sélectionné). Voici ce que j'ai trouvé :

def weightedChoice(choices):
    """Like random.choice, but each element can have a different chance of
    being selected.

    choices can be any iterable containing iterables with two items each.
    Technically, they can have more than two items, the rest will just be
    ignored.  The first item is the thing being chosen, the second item is
    its weight.  The weights can be any numeric values, what matters is the
    relative differences between them.
    """
    space = {}
    current = 0
    for choice, weight in choices:
        if weight > 0:
            space[current] = choice
            current += weight
    rand = random.uniform(0, current)
    for key in sorted(space.keys() + [current]):
        if rand < key:
            return choice
        choice = space[key]
    return None

Cette fonction me semble excessivement complexe, et laide. J'espère que tout le monde ici pourra faire des suggestions pour l'améliorer ou trouver d'autres façons de la réaliser. L'efficacité n'est pas aussi importante pour moi que la propreté et la lisibilité du code.

Demandé el 9 de Septembre, 2010 par Colin

Answer 1

5 Réponses

Answer 2

397voto

Ronan Paixão Points 11

Depuis la version 1.7.0, NumPy dispose d'une fonction choice qui prend en charge les distributions de probabilité.

from numpy.random import choice
draw = choice(list_of_candidates, number_of_items_to_pick, p=probability_distribution)

Notez que probability_distribution est une séquence dans le même ordre de list_of_candidates . Vous pouvez également utiliser le mot-clé replace=False pour modifier le comportement afin que les éléments tirés au sort ne soient pas remplacés.

Répondu el 4 de Octobre, 2014 par Ronan Paixão (11 Points )

27 votes

D'après mes tests, cela est un ordre de grandeur plus lent que random.choices pour les appels individuels. Si vous avez besoin d'un grand nombre de résultats aléatoires, il est vraiment important de les choisir tous en même temps en ajustant number_of_items_to_pick . Si vous le faites, c'est un ordre de grandeur plus rapide.

Commenté el 7 de Avril, 2018 par jpmc26

5 votes

Cela ne fonctionne pas avec les tuples, etc. ("ValueError : a must be 1-dimensional"). Dans ce cas, on peut demander à numpy de choisir l'option indice dans la liste, c'est-à-dire len(list_of_candidates) et ensuite faire list_of_candidates[draw]

Commenté el 18 de Mars, 2019 par xjcl

0 votes

Maintenant vous avez une méthode de choix dans le module aléatoire

Commenté el 21 de Juillet, 2020 par Jitin

Afficher 1 autres commentaires

Answer 3

142voto

Ned Batchelder Points 128913

def weighted_choice(choices):
   total = sum(w for c, w in choices)
   r = random.uniform(0, total)
   upto = 0
   for c, w in choices:
      if upto + w > r:
         return c
      upto += w
   assert False, "Shouldn't get here"

Répondu el 9 de Septembre, 2010 par Ned Batchelder (128913 Points )

10 votes

Vous pouvez abandonner une opération et gagner un peu de temps en inversant les instructions à l'intérieur de la boucle for : upto +=w; if upto > r

Commenté el 31 de Juillet, 2013 par knite

7 votes

Sauvegarder une variable en supprimant jusqu'à et en décrémentant r du poids à chaque fois. La comparaison est alors if r < 0

Commenté el 31 de Mars, 2014 par JnBrymn

0 votes

@JnBrymn Vous devez vérifier r <= 0 . Considérons un ensemble d'entrée de 1 élément, et un résultat de 1,0. L'assertion échouera alors. J'ai corrigé cette erreur dans la réponse.

Commenté el 11 de Novembre, 2015 par moooeeeep

Afficher 6 autres commentaires

Answer 4

80voto

Raymond Hettinger Points 231

Classez les poids dans une distribution cumulative.
Utilisez random.random() pour choisir un float 0.0 <= x < total .
Rechercher la distribution en utilisant bisect.bisect comme comme le montre l'exemple à http://docs.python.org/dev/library/bisect.html#other-examples .

from random import random from bisect import bisect

def weighted_choice(choices): values, weights = zip(*choices) total = 0 cum_weights = [] for w in weights: total += w cum_weights.append(total) x = random() * total i = bisect(cum_weights, x) return values[i]

weighted_choice([("WHITE",90), ("RED",8), ("GREEN",2)]) 'WHITE'

Si vous devez faire plus d'un choix, divisez cette fonction en deux, l'une pour construire les poids cumulés et l'autre pour effectuer une bissectrice vers un point aléatoire.

Répondu el 1 de Décembre, 2010 par Raymond Hettinger (231 Points )

5 votes

Cette réponse est plus efficace que celle de Ned. En fait, au lieu de faire une recherche linéaire (O(n)) parmi les choix, il fait une recherche binaire (O(log n)). +1 !

Commenté el 14 de Mars, 2014 par NHDaly

0 votes

L'index du tuple est hors de portée si random() retourne 1.0

Commenté el 17 de Juillet, 2014 par Jon Vaughan

11 votes

Cela fonctionne toujours dans O(n) à cause du calcul de la distribution cumulative.

Commenté el 16 de Novembre, 2014 par Lev Levitsky

Afficher 3 autres commentaires

Answer 5

24voto

pweitzman Points 61

Si cela ne vous dérange pas d'utiliser numpy, vous pouvez utiliser numpy.random.choice .

Par exemple :

import numpy

items  = [["item1", 0.2], ["item2", 0.3], ["item3", 0.45], ["item4", 0.05]
elems = [i[0] for i in items]
probs = [i[1] for i in items]

trials = 1000
results = [0] * len(items)
for i in range(trials):
    res = numpy.random.choice(items, p=probs)  #This is where the item is selected!
    results[items.index(res)] += 1
results = [r / float(trials) for r in results]
print "item\texpected\tactual"
for i in range(len(probs)):
    print "%s\t%0.4f\t%0.4f" % (items[i], probs[i], results[i])

Si vous savez à l'avance combien de sélections vous devez effectuer, vous pouvez le faire sans boucle comme celle-ci :

numpy.random.choice(items, trials, p=probs)

Répondu el 21 de Mars, 2013 par pweitzman (61 Points )

Answer 6

17voto

Paul McGuire Points 24790

Brut, mais peut être suffisant :

import random
weighted_choice = lambda s : random.choice(sum(([v]*wt for v,wt in s),[]))

Est-ce que ça marche ?

# define choices and relative weights
choices = [("WHITE",90), ("RED",8), ("GREEN",2)]

# initialize tally dict
tally = dict.fromkeys(choices, 0)

# tally up 1000 weighted choices
for i in xrange(1000):
    tally[weighted_choice(choices)] += 1

print tally.items()

Imprimés :

[('WHITE', 904), ('GREEN', 22), ('RED', 74)]

On suppose que tous les poids sont des entiers. Il n'est pas nécessaire que leur somme soit égale à 100, je l'ai simplement fait pour faciliter l'interprétation des résultats du test. (Si les poids sont des nombres à virgule flottante, multipliez-les tous par 10 de manière répétée jusqu'à ce que tous les poids >= 1).

weights = [.6, .2, .001, .199]
while any(w < 1.0 for w in weights):
    weights = [w*10 for w in weights]
weights = map(int, weights)

Répondu el 9 de Septembre, 2010 par Paul McGuire (24790 Points )

1 votes

Bien, je ne suis pas sûr que je puisse supposer que tous les poids sont des entiers, cependant.

Commenté el 9 de Septembre, 2010 par Colin

1 votes

Il semble que vos objets seraient dupliqués dans cet exemple. Ce serait inefficace (tout comme la fonction de conversion des poids en entiers). Néanmoins, cette solution est une bonne solution unique si les poids entiers sont petits.

Commenté el 22 de Décembre, 2013 par wei2912

0 votes

Les primitives seront dupliquées, mais les objets n'auront que des références dupliquées, pas les objets eux-mêmes. (c'est la raison pour laquelle vous ne pouvez pas créer une liste de listes en utilisant la commande [[]]*10 - tous les éléments de la liste extérieure pointent vers la même liste.

Commenté el 20 de Juillet, 2015 par Paul McGuire

Afficher 1 autres commentaires

Une version pondérée de random.choice

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

Une version pondérée de random.choice

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: