Permettez-moi d'ajouter mon 5c, c'est mon travail pour obtenir de bons et de nettoyer les données pour un hedge-fund, j'ai vu beaucoup de flux de données et de l'historique des données des fournisseurs. C'est principalement à propos de NOUS disposons de données.
Pour commencer, si vous avez un peu d'argent ne vous embêtez pas avec le téléchargement de données à partir de Yahoo, obtenir la fin de la journée les données directement à partir CSI de données, c'est là que Yahoo a son NEM de données ainsi autant que je sache. Ils ont une API dans laquelle vous pouvez extraire les données de n'importe quel format que vous voulez. Je pense que l'abonnement annuel pour les données est l'un des quelques 100$ bucks.
Le principal problème avec le téléchargement de données à partir d'un service gratuit, c'est que vous obtenez seulement les stocks qui existent encore, ce qui est appelé Biais du Survivant et peut vous donner des résultats erronés si vous regardez un grand nombre de stocks, car vous n'aurez qu'à inclure ceux qui a de si loin, et pas ceux qui ont été radiées de la cote.
Pour jouer avec une certaine intraday de données que j'avais regarder dans IQFeed, ils fournissent plusieurs Api pour extraire des données historiques, bien qu'ils soient principalement une tenue en temps réel des flux. Mais ici, il ya quelques options, certains courtiers même fournir un historique des téléchargements de données via leurs Api, il suffit donc de choisir votre poison.
MAIS généralement, l'ensemble de ces données n'est pas très propre, une fois que vous commencez vraiment à dos de test, vous verrez que certains stocks sont manquants ou apparaissent comme deux symboles différents, ou des fractionnements d'actions ne sont pas correctement prises en compte, etc. Et puis vous vous rendez compte que les historiques de données sur les dividendes est tout aussi bien et alors vous commencez à tourner en rond, l'application des correctifs de données à partir de 100 différentes sources de données et ainsi de suite. Donc, pour commencer avec une "réduction" de flux de données va le faire, mais dès que vous l'exécutez plus complet backtests vous pourriez avoir des problèmes en fonction de ce que vous faites. Si vous venez de regarder, disons, le S&P 500 actions ce ne sera pas tellement un problème et un "pas cher" intraday flux de le faire.
Ce que vous ne trouverez pas est gratuit intraday de données. Je veux dire que vous pouvez trouver des exemples, je suis sûr qu'il ya quelque part à 5 ans de MSFT tique de données flottant autour de lui, mais que vous n'obtiendrez pas très loin.
Alors si vous avez besoin de la vraie substance (niveau II carnet de commande, toutes les tiques, comme ils l'ont passé à tous les échanges), il n'y a vraiment qu'un seul "abordable" l'option qui existe et qui est Nanex. Ils seront en fait vous expédier un disque avec des téraoctets de données. Si je me souviens bien de son sujet de $3k-4K par année de données. Mais croyez-moi, une fois que vous comprenez combien il est difficile d'obtenir de bonnes données intraday, vous ne pensez pas que ce est beaucoup d'argent du tout.
De ne pas vous décourager, mais pour obtenir de bonnes données est dur, si dur dans le fait que de nombreux hedge-funds et les banques dépensent des centaines de milliers de dollars d'un mois pour obtenir les données qu'ils peuvent faire confiance. Encore une fois, vous pouvez commencer à quelque part, puis à partir de là, mais il est bon de voir un peu dans le contexte.