Je suis en train de construire un Crawler web pour les données liées. J'ai différencié les pages HTML et RDF/XML par le code suivant :
public static int checktype(URL url) throws IOException
{
String contentType = ((HttpURLConnection) url.openConnection()).getContentType();
System.out.println("Website is read");
int t=0;
if("text/html".equals(contentType)) {t=0;}
else if("application/rdf+xml".equals(contentType)) {t=1;}
System.out.println(contentType);
return t;
}
Je veux maintenant analyser une page web avec des données RDF/XML pour extraire tous les URI de cette page. Je peux trouver des analyseurs HTML mais pas pour les données liées. Merci de m'aider