Pour célébrer les 20 000 ème question avec le r-tag sur un Débordement de Pile, veuillez m'aider à extraire les R les dates de sortie à partir de la page de Wikipedia.
Mes tentatives:
library(XML)
x <- readHTMLTable("http://en.wikipedia.org/wiki/R_(programming_language)")
Cela ne fonctionne pas, car la table est en fait une liste, pas un tableau HTML.
library(httr)
x <- GET("http://en.wikipedia.org/wiki/R_(programming_language)")
text <- content(x, "parsed")
Cet extrait le texte, mais mon xpath
est rouillé, donc je ne pouvais pas tirer les dates de sortie.
Comment puis-je faire cela?
PS. La page Wikipedia est la seule source que j'ai pu trouver, mais s'il vous plaît n'hésitez pas à poster une solution à l'aide canonique source, si il y en a un.