Je n'ai pas essayé de faire sans formation l'analyse des sentiments tels que vous décrivez, mais du haut de ma tête, je dirais que vous êtes trop simplifier le problème. Tout simplement l'analyse des adjectifs n'est pas suffisant pour obtenir une bonne compréhension du sentiment d'un texte; par exemple, prenons le mot " stupide.' Seul, vous permettrait de classifier que comme négatif, mais si l'examen d'un produit, ont '... [x] produit rend leurs concurrents paraître stupide pour ne pas penser de cette fonction première...' puis le sentiment, il y aurait certainement positif. Le plus contexte où les mots apparaissent certainement des questions à quelque chose comme cela. C'est pourquoi un débutant sac-de-mots seule approche (a fortiori encore plus limitée sac-de-adjectifs) n'est pas assez pour lutter contre ce problème de manière adéquate.
La pré-classés de données (formation de "data") aide à que le problème se déplace de tenter de déterminer si un texte est positif ou sentiment négatif à partir de zéro, en essayant de déterminer si le texte est plus semblable à positif textes ou négatif textes, et de les classer de cette façon. L'autre grand point est que l'analyse de texte tels que l'analyse de sentiment, sont souvent touchés fortement par les différences de caractéristiques des textes en fonction sur le domaine. C'est pourquoi avoir un bon ensemble de données de formation (à l'est, des données précises à partir de l'intérieur du domaine dans lequel vous travaillez, et, je l'espère, représentant des textes que vous allez avoir à classer) est aussi important que la construction d'un bon système pour classer les avec.
Pas exactement un article, mais espère que ça aide.