146 votes

Comment le Amazon Recommandation de la fonction de travail?

Ce que la technologie va dans les coulisses d'Amazon recommandation de la technologie? Je crois qu'Amazon recommandation est actuellement le meilleur sur le marché, mais comment font-ils de nous fournir de telles recommandations pertinentes?

Récemment, nous avons été impliqués recommandation similaire genre de projet, mais aimerais savoir à propos de l'en et les aboutissants de l'Amazonie recommandation de la technologie à partir d'un point de vue technique.

Toute entrée serait très apprécié.

Mise à jour:

Ce brevet explique comment les recommandations personnalisées sont à faire, mais il n'est pas très technique, et donc, ce serait vraiment sympa si certaines idées pourraient être fournis.

À partir des commentaires de Dave, l'Affinité de l'Analyse constitue la base pour ce genre de Moteurs de Recommandation. Aussi, voici quelques bonnes lectures sur le Sujet

  1. Démystifier L'Analyse Du Panier D'Achat
  2. Analyse Du Panier D'Achat
  3. L'Affinité De L'Analyse

Suggestions De Lecture:

  1. Exploration de données: Concepts et des techniques de

106voto

Dave Quick Points 929

Il est à la fois un art et une science. Typique des domaines d'études s'articulent autour de l'analyse du panier d'achat (également appelée affinité analyse) qui est un sous-ensemble du champ de l'exploration de données. Les composants typiques dans un tel système d'identification du conducteur principal des éléments et de l'identification de l'affinité des éléments (accessoires de montée en gamme, cross sell).

Gardez à l'esprit les sources de données qu'ils ont à la mienne...

  1. Acheté des caddies = de l'argent réel à partir de personnes réelles passé sur des éléments réels = données puissant et beaucoup de lui.
  2. Les éléments ajoutés à des charrettes, mais abandonné.
  3. Des expériences de tarification en ligne (A/B testing, etc.) où ils offrent les mêmes produits à des prix différents et de voir les résultats
  4. L'emballage des expériences (A/B testing, etc.) où ils offrent des produits différents dans différents "paquets" ou d'actualisation différents couples d'éléments
  5. Idées de cadeaux - ce qui est précisément pour vous - et dans l'ensemble il peut être traité de la même manière à un autre flux de données de l'analyse du panier
  6. Sites de référence (identification d'où vous est venue de peut soupçon autres points d'intérêt)
  7. Le temps de séjour (combien de temps avant que vous cliquez sur et sélectionnez un autre élément)
  8. Les cotes par vous ou les personnes de votre réseau social à acheter et/ou cercles - si-vous des choses que vous aimez que vous obtenez plus de ce que vous voulez, et si vous confirmez avec le "j'ai déjà des" bouton-ils créer un profil complet de vous
  9. Des informations démographiques (votre adresse de livraison, etc.) - ils savent ce qui est populaire dans votre quartier pour vos enfants, vous-même, votre conjoint, etc.
  10. l'utilisateur segmentation = avez-vous acheté 3 livres dans différents mois pour un tout-petit? de chances d'avoir un enfant ou plus.. etc.
  11. Le marketing Direct cliquez sur par le biais des données - avez-vous reçu un mail de leur part et cliquez sur par le biais de? Ils savent par courriel, qui il était et ce que vous avez cliqué sur et si vous l'avez acheté.
  12. Cliquez sur les chemins de session - qu'avez-vous vue, indépendamment de savoir si il est allé dans votre panier
  13. Nombre de fois vu un article avant de l'acheter
  14. Si vous faites affaire avec une brique et de mortier magasin, ils pourraient avoir des physiques de votre historique d'achat à aller hors de la ainsi (c'est à dire toys r us ou quelque chose qui est en ligne et aussi un magasin physique)
  15. etc. etc. etc.

Heureusement, les gens se comportent de la même manière dans l'ensemble de sorte que le plus qu'ils savent à propos de l'achat de la population dans son ensemble le mieux qu'ils savent ce qui va et ne se vendra pas et avec chaque transaction et chaque notation/liste d'envies ajouter/parcourir ils savent plus personnellement d'adapter les recommandations. Gardez à l'esprit ce n'est probablement qu'un petit échantillon de l'ensemble des influences de ce qui se retrouve dans les recommandations, etc.

Maintenant, je n'ai pas l'intérieur de la connaissance de la façon dont Amazon (n'a jamais travaillé), et tout ce que je suis en train de faire est de parler des approches classiques pour le problème du commerce en ligne - j'ai utilisé de la PM qui a travaillé sur l'exploration de données et de l'analytique pour le produit Microsoft appelle le Serveur de Commerce. Nous avons expédié dans microsoft Commerce Server les outils qui ont permis à des personnes de créer des sites avec des fonctionnalités similaires.... mais le plus grand que le volume de ventes le mieux les données le mieux le modèle d'Amazon est GRAND. Je peux seulement imaginer comment il est amusant de jouer avec des modèles avec une quantité de données dans un commerce site piloté par. Maintenant, beaucoup de ces algorithmes (comme le prédicteur qui a commencé dans le commerce server) ont déménagé à vivre directement dans Microsoft SQL.

Les quatre grandes une des façons que vous devriez avoir:

  1. Amazon (ou un distributeur) est à la recherche à des données agrégées pour des tonnes de transactions et des tonnes de gens... cela permet à même de recommander assez bien pour les utilisateurs anonymes sur leur site.
  2. Amazon (ou toute sophistiqué détaillant) est de garder la trace de comportement et d'achat de quelqu'un qui est connecté et en les utilisant pour affiner sur le dessus de la masse de données agrégées.
  3. Souvent, il ya un moyen de cours d'équitation le cumul des données et la prise de "éditorial" contrôle de suggestions pour les chefs de produit de lignes spécifiques (comme une certaine personne qui est propriétaire de la 'appareils photo numériques' vertical ou les "romans d'amour" vertical ou similaire) où ils sont de véritables experts
  4. Il y a souvent des offres de promotion (c'est à dire sony ou panasonic ou nikon ou canon ou sprint ou verizon paie de l'argent pour le détaillant, ou donne une meilleure réduction à de plus grandes quantités ou d'autres choses dans ces lignes) qui sera la cause de certains des "suggestions" pour atteindre le sommet plus souvent que les autres - il y a toujours quelques raisonnable des affaires et la logique de la raison derrière cette ciblées à faire de plus sur chaque transaction ou de réduire les coûts de gros, etc.

En termes de mise en œuvre effective? Juste au sujet de tous les grands systèmes en ligne se résument à un ensemble de canalisations (ou un modèle de filtre de mise en œuvre ou d'un flux de travail, etc. vous appelez ça comme vous voulez) qui permettent un contexte pour être évalué par une série de modules qui s'appliquent à une certaine forme de logique d'entreprise.

Typiquement, un autre pipeline serait associé à chaque tâche distincte sur la page - vous pouvez en avoir un qui n'a recommandé de "packages/mises à jour" (c'est à dire acheter des ce avec l'article que vous êtes en train de regarder) et qui n' "alternatives" (c'est à dire acheter ce au lieu de la chose que vous êtes en train de regarder) et un autre qui tire les articles les plus étroitement liées l'une à partir de votre liste de souhaits (par catégorie de produits ou similaire).

Les résultats de ces pipelines sont en mesure d'être placé sur les différentes parties de la page (au-dessus de la barre de défilement, en dessous de la faire défiler, sur la gauche, sur la droite, les différentes polices de caractères, la taille différente des images, etc.) et testé pour voir lesquelles fonctionnent le mieux. Depuis que vous utilisez agréable facile à brancher et jouer à des modules qui définissent la logique métier pour ces pipelines de vous retrouver avec l'équivalent moral de blocs de lego qui font qu'il est facile de sélectionner à partir de la logique d'entreprise que vous souhaitez appliquer lorsque vous construire un nouveau pipeline qui permet à une innovation plus rapide, plus l'expérimentation, et à la fin des profits plus élevés.

N'a que peu d'aide? Espérons que vous donner un peu d'un aperçu de la façon dont cela fonctionne, en général, à peu près n'importe quel site d'e-commerce - pas seulement Amazon. Amazon (en parlant à des amis qui y ont travaillé) est très piloté par les données et de mesure en continu de l'efficacité de l'expérience utilisateur et la tarification, la promotion, l'emballage, etc. - ils sont très sophistiqués détaillant en ligne et sont susceptibles d'être à la pointe de beaucoup d'algorithmes qu'ils utilisent pour optimiser le profit et ceux qui sont susceptibles de secrets commerciaux (vous savez, comme la formule de KFC secrète d'épices) et guaarded en tant que tel.

28voto

Justin Peel Points 17348

Ce n'est pas directement liée à Amazon, système de recommandation, mais il pourrait être utile d'étudier les méthodes utilisées par les personnes qui ont concouru à la Netflix Prize, un concours pour développer un meilleur système de recommandation à l'aide de Netflix données de l'utilisateur. Beaucoup de bonnes informations qui existent dans leur communauté sur les techniques d'exploration de données en général.

L'équipe qui a gagné utilisé un mélange de ces recommandations générées par beaucoup de différents modèles et différentes techniques. Je sais que certaines des principales méthodes utilisées ont été l'analyse en composantes principales, le plus proche voisin des méthodes, et des réseaux de neurones. Voici quelques documents de l'équipe gagnante:

R. Bell, Y. Koren, C. Volinsky, "La BellKor 2008 Solution à la Netflix Prize", (2008).

A. Töscher, M. Jahrer, "La BigChaos Solution à la Netflix Prix 2008", (2008).

A. Töscher, M. Jahrer, R. Legenstein, "l'Amélioration de Voisinage Fondée sur des Algorithmes à Grande Échelle Prescripteur Systèmes", SIGKDD Atelier sur une Grande Échelle de Prescripteur des Systèmes et de l'Netflix Prix de la Concurrence (KDD'08) , ACM Press (2008).

Y. Koren, "La BellKor Solution à la Netflix Grand Prix", (2009).

A. Töscher, M. Jahrer, R. Bell, "La BigChaos Solution à la Netflix Grand Prix", (2009).

M. Piotte, M. Chabbert, "La Pragmatique de la Théorie de la solution à la Netflix Grand Prix", (2009).

2008 les papiers sont de la première année, les Progrès de Prix. Je recommande la lecture des précédents, d'abord parce que les plus tard appuyer sur les travaux antérieurs.

23voto

ewernli Points 23180

Je suis tombé sur cet article aujourd'hui:

Peut-être qu'il fournit des informations supplémentaires.

20voto

Jason R Points 81

(Clause de non-responsabilité: j'ai l'habitude de travailler sur Amazon, même si je n'ai pas de travail sur les recommandations de l'équipe.)

ewernli la réponse devrait être la bonne -- le document de liens vers Amazon recommandation initiale du système, et de ce que je peux dire (à la fois de l'expérience personnelle comme une Amazone shopper et ayant travaillé sur des systèmes similaires dans d'autres entreprises), très peu de choses ont changé: à la base, de recommandation Amazon est encore très largement basée sur le point-à-point de filtrage collaboratif.

Il suffit de regarder la forme de recommandations à prendre: sur ma première page, ils sont tous soit de la forme "Vous avez vu X...des Clients qui ont également regardé ce aussi vu...", ou bien un mélange d'éléments semblables aux choses que j'ai acheté ou vu avant. Si j'ai particulièrement aller à mon "Recommandé pour Vous" de la page, chaque article explique pourquoi il est recommandé pour moi: "Recommandé parce que vous avez acheté...", "Recommandé car vous avez ajouté X à votre liste de souhaits...", etc. C'est un signe classique de point-à-point de filtrage collaboratif.

Alors, comment ne point-à-point filtrage collaboratif de travail? En gros, pour chaque élément, vous construire un "quartier" d'éléments connexes (par exemple, en regardant ce que les articles que les gens ont vu ensemble ou des éléments que les gens ont acheté ensemble, pour déterminer la similarité, vous pouvez utiliser des paramètres comme l' indice de Jaccard, de corrélation est une autre possibilité, bien que je soupçonne Amazon n'utilise pas les données de classement, très fortement). Ensuite, chaque fois que je l'ai vue un élément X ou effectuer un achat Y, Amazon suggère de moi des choses dans le même quartier que X ou Y.

Quelques autres approches que Amazon pourrait potentiellement utiliser, mais les chances de ne pas, sont décrites ici: http://blog.echen.me/2011/02/15/an-overview-of-item-to-item-collaborative-filtering-with-amazons-recommendation-system/

Beaucoup de ce que Dave décrit est presque certainement pas fait à Amazon. (Notes par ceux de mon réseau social? Nope, Amazon n'a pas aucun de mes données sociales. Ce serait un énorme problème de confidentialité dans tous les cas, donc il faudrait être difficile pour Amazon à faire, même si ils avaient que des données: les gens ne veulent pas que leurs amis pour savoir ce que les livres ou les films qu'ils achètent. L'information démographique? Nope, rien dans les recommandations suggère de regarder cette. [Contrairement à Netflix, qui n'surface de ce que d'autres personnes dans ma région sont à regarder.])

3voto

jsquires Points 2526

Je n'ai pas connaissance d'Amazon algorithme particulier, mais de l'une des composantes d'un tel algorithme serait probablement impliquer le suivi des groupes d'éléments fréquemment commandés, et puis en utilisant les données pour recommander d'autres éléments dans le groupe quand un client achète un sous-ensemble du groupe.

Une autre possibilité serait de suivre la fréquence de l'élément B de commander moins de N jours après la commande d'Un élément, qui pourrait suggérer une corrélation.

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X