47 votes

Prédire les valeurs boursières

Je suis en train de construire un web sémantique projet qui réunit le montant maximal de l'historique des données sur une certaine société et tente de prédire l'avenir du marché de la valeur des stocks.

Pour les données que j'ai l'historique de la valeur d'une action (non normalisée), actualités (0 à 1 de la polarité) et subjective du contenu (de 0 à 1 de polarité).

Quel est le meilleur système d'IA à former et utiliser pour ce type d'objectif? Est un simple NN avec rétro-propagation de la formation du mieux que je peux espérer?

mise à jour: tout le monde est préoccupé par la qualité de ce système. Même si je suis sûr que le système est aussi bon qu'un hasard de prédiction (ou pire), c'est un projet d'école autour de l'intelligence artificielle et web sémantique. Donc, je me préoccupe seulement de choisir le meilleur type de train méthode pour les données que j'ai (NN, RBF, SVM, Bayes, neuro-flou, etc). Ce n'est pas de faire de l'argent.

26voto

Eric Points 5994

Il n'est pas possible de vous dire qui d'apprentissage de la machine technique donnera les meilleures performances grâce à toutes ces techniques sont très sensibles à la durée réelle de la série vous essayez de les former et de la façon dont vous vous entraînez. Donc, pour un projet d'école, je voudrais plutôt vous recommandons de mettre en œuvre de multiples techniques et de comparer leurs performances. (Vous devez également mettre en œuvre plus d'une version de chaque technique, par exemple pour différents nombres de couches et des noeuds dans votre les modèles neuronaux.) Ce sera bien mieux, parce que vous serez à réfléchir et à écrire sur les forces relatives des modèles plutôt que de simplement déconner avec l'un d'eux.

En plus de la prédiction de la performance à la fois sur les formés de données et, plus tard, non formés données, que pouvez-vous dire au sujet de leur capacité prédictive (au sein de l'historique des données), par rapport à la quantité d'informations qu'ils sont stocker (c'est à dire le nombre de variables dans le modèle)? Aussi, comment font-ils sur plus prévisibles les séquences comme des ondes sinusoïdales et les polynômes, ou définitivement imprévisible comme les marches aléatoires?

Et pouvez-vous mettre en place un système où vous n'apprenez pas à tous, vous avez juste la recherche de votre séquence de test (ou une fonction) au sein de l'origine historique de l'ensemble de données? Comment fonctionne cet algorithme?

Comme une alternative à des techniques d'apprentissage automatique, vous pouvez également envisager quelque chose avec plus d'un expert-système de saveur. Par exemple, vous pourriez mettre en œuvre une technique d'analyse sur les stratégies de graphiques en chandeliers dire, ou de Fibonacci bandes) et de voir comment il se comporte.

Enfin, pour une vision plus réaliste du projet, vous pouvez appliquer l'une de ces techniques pour les systèmes où il est vraiment possible de gagner de l'argent-par exemple le modèle (ou localisation) deux temps différents de la série qui contiennent des possibilités d'arbitrage, et d'obtenir votre programme pour reconnaître ceux.

BTW, Le comportement de Marchés est un autre livre intéressant sur le pourquoi de la prédiction du prix est dur.

EDIT: Donc, pour réellement répondre à votre question (!) non, NN w/ arrière prop n'est pas nécessairement le mieux que vous puissiez espérer. Mais il ne sera probablement parfait.

EDIT: Si votre projet est vraiment plus sur l'obtention de données que de l'analyser, est-il quelque chose d'autre que vous pourriez faire à la place de la prédiction? Par exemple, vous pourriez détecter lorsque les arrêts de négociation doit entrer en jeu, ou lorsqu'une vente à découvert règle s'applique, ou quelque chose comme ça?

6voto

James Black Points 26183

Le problème, c'est que vous êtes en essayant de prédire quelque chose où vous n'avez pas assez de variables dans votre système.

Vous avez un cours de l'action qui est en dehors de tout contexte, donc, ne les stocks aller vers le haut ou vers le bas en raison d'un concurrent? Il est peut-être un nouveau concurrent qui a trébuché, de sorte que le stock a augmenté, mais, si le concurrent obtenir leur acte ensemble, il pourrait sérieusement déprimer la bourse de l'entreprise.

Si votre entreprise est une entreprise qui fait de l'externalisation. Si vous ne prenez pas en compte la manière dont les règles du marché peuvent changer votre prédiction va être, car, si les entreprises ont à payer des taxes supplémentaires pour l'externalisation, puis qui permettra de voir un changement dans les ressources.

Ensuite, vous avez la météo et les catastrophes naturelles qui peuvent causer le stock de changer radicalement.

Ce que vous devez faire est de créer un simulateur, et le plus de variables que vous pouvez inclure dans votre simulateur de mieux vous vous trouvez.

Par exemple, quelles sont les chances qu'une grève de la NFL peut arriver, comme, vous pouvez trouver que vous vendez des produits à des entreprises qui vendent à des équipes de la NFL, alors que peut avoir un impact sur votre chiffre d'affaires, de sorte que les prix des actions.

Vous pouvez le modèle avec un réseau de neurones, et il peut venir avec un moyen de prédire avec précision le passé, les évaluations boursières, étant donné un point dans le temps, mais il ne sera pas plus précis pour l'évolution future des prix de une marche aléatoire ferait, comme c'est une supposition.

Un simulateur va donner une série, étant donné que si certaines conditions sont remplies, il est alors prédictions peut être plus proche, de l'OMI.

Mise à JOUR:

Je ne crois pas un NN serait un bon choix, car il n'y a aucun moyen de tester, après la formation, pour voir si les résultats sont corrects, sauf si vous vous entraînez jusqu'en juin 2009, puis choisissez l'une des valeurs après à voir comment elle le fait.

À l'aide de la logique floue peut être votre meilleur pari, car il semble traiter avec des inconnus, mais, vous voulez probablement obtenir une gamme pour le possible du prix des actions.

Si vous utilisez web sémantique, vous pouvez utiliser certaines d'exploration de données, et de voir si vous pouvez déterminer quels événements peuvent être le principal facteur prédictif d'un stock de changement de prix, puis d'un réseau de neurones peut être plus utile.

4voto

BCS Points 18500

Si vous faites ça comme une expérience, et ne comptez pas sur le fait d'acheter des actions, je voudrais race (GA) décision/de l'équation des arbres ou des réseaux de neurones en tenant compte de plusieurs actions ou catégories d'actions. Les choses je veux le regarder pour sont où les changements dans les tendances de l'un stock ont tendance à effectuer d'autres actions.

(p.s. Ce ne sera utile que pour la spéculation et pour ce cas, il convient de souligner que la réalité de l'achat du stock en question pourrait avoir un effet suffisamment important pour tuer tous les bénéfices du marché. Je n'ai aucune idée de la façon dont les commandes d'achat, le marché et la seule façon de le savoir serait d'acheter et de voir.)

3voto

Martin Beckett Points 60406
 price = price * rand()/(float)RAND_MAX;
 

est également très bon.

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X