48 votes

Analyse de sentiment non supervisée

J'ai lu beaucoup d'articles qui expliquent la nécessité d'un premier ensemble de textes qui sont classés comme étant soit "positive" ou "négative" avant une analyse du sentiment système fonctionnera vraiment.

Ma question est: quelqu'un A tenté de faire juste un rudimentaire case de "positive" des adjectifs vs "négatif" adjectifs en tenant compte de la simple negators pour éviter que le classement "pas heureux" comme positif? Si oui, existe-il des articles qui traitent juste pourquoi cette stratégie n'est pas réaliste?

Merci d'avance, Dave --Trindaz sur Fedang #le sentiment d'analyse

70voto

larsmans Points 167484

Un article classique de Peter Turney (2002) explique une méthode pour effectuer une analyse de sentiment non supervisée (classification positive / négative) en utilisant uniquement les mots excellent et pauvre comme graine. Turney utilise l' information mutuelle d'autres mots avec ces deux adjectifs pour atteindre une précision de 74%.

20voto

waffle paradox Points 1806

Je n'ai pas essayé de faire sans formation l'analyse des sentiments tels que vous décrivez, mais du haut de ma tête, je dirais que vous êtes trop simplifier le problème. Tout simplement l'analyse des adjectifs n'est pas suffisant pour obtenir une bonne compréhension du sentiment d'un texte; par exemple, prenons le mot " stupide.' Seul, vous permettrait de classifier que comme négatif, mais si l'examen d'un produit, ont '... [x] produit rend leurs concurrents paraître stupide pour ne pas penser de cette fonction première...' puis le sentiment, il y aurait certainement positif. Le plus contexte où les mots apparaissent certainement des questions à quelque chose comme cela. C'est pourquoi un débutant sac-de-mots seule approche (a fortiori encore plus limitée sac-de-adjectifs) n'est pas assez pour lutter contre ce problème de manière adéquate.

La pré-classés de données (formation de "data") aide à que le problème se déplace de tenter de déterminer si un texte est positif ou sentiment négatif à partir de zéro, en essayant de déterminer si le texte est plus semblable à positif textes ou négatif textes, et de les classer de cette façon. L'autre grand point est que l'analyse de texte tels que l'analyse de sentiment, sont souvent touchés fortement par les différences de caractéristiques des textes en fonction sur le domaine. C'est pourquoi avoir un bon ensemble de données de formation (à l'est, des données précises à partir de l'intérieur du domaine dans lequel vous travaillez, et, je l'espère, représentant des textes que vous allez avoir à classer) est aussi important que la construction d'un bon système pour classer les avec.

Pas exactement un article, mais espère que ça aide.

8voto

Trung Huynh Points 51

Le papier de Turney (2002), mentionnées par larsmans est une bonne base. Dans une nouvelle recherche, Li, et Il [2009] introduire une approche à l'aide Latent Dirichlet Allocation (LDA) pour former un modèle qui permet de classer un article du sentiment global et sujet à la fois dans un totalement sans surveillance manière. L'exactitude atteindre est de 84,6%.

2voto

Dexter Points 1988

David,

Je ne sais pas si cela aide, mais vous voudrez peut-être consulter le blog de Jacob Perkin sur l'utilisation de NLTK pour l'analyse des sentiments.

2voto

atrilla Points 21

J'ai essayé de repérage de mots clés à l'aide d'un dictionnaire de l'affect à prédire le sentiment de l'étiquette au niveau des phrases. Compte tenu de la portée générale de ce vocabulaire (hors domaine à charge), les résultats ont été d'environ 61%. Le document est disponible dans ma page d'accueil.

En quelque sorte dans une version améliorée, la négation des adverbes ont été considérés. L'ensemble du système, nommé EmoLib, est disponible pour la démo:

http://dtminredis.housing.salle.url.edu:8080/EmoLib/

En ce qui concerne,

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X