Quels sont les types de contenu corrects pour les documents XML, HTML et XHTML?
J'ai besoin d'écrire un robot simple qui ne récupère que ces types de fichiers.
De nos jours, http://somedomain.com/index.html peut servir par exemple un fichier JPEG en raison de mod_rewrite. Je dois donc vérifier le type de contenu de l'en-tête de la réponse et le comparer à une liste de types de contenu autorisés.
Où puis-je obtenir une telle liste?