147 votes

Type de contenu valide pour les documents XML, HTML et XHTML

Quels sont les types de contenu corrects pour les documents XML, HTML et XHTML?

J'ai besoin d'écrire un robot simple qui ne récupère que ces types de fichiers.

De nos jours, http://somedomain.com/index.html peut servir par exemple un fichier JPEG en raison de mod_rewrite. Je dois donc vérifier le type de contenu de l'en-tête de la réponse et le comparer à une liste de types de contenu autorisés.

Où puis-je obtenir une telle liste?

244voto

bobince Points 270740

HTML: text/html, l'arrêt complet.

XHTML: application/xhtml+xml, ou seulement si le code HTML suivant compatbility lignes directrices, text/html. Voir le W3 Types de Supports Remarque.

XML: text/xml, application/xml (RFC 2376).

Il y a aussi beaucoup d'autres types de médias basée autour de XML, par exemple application/rss+xml ou image/svg+xml. Il y a fort à parier que toute méconnu, mais inscrits se terminant en +xml est basé sur XML. Voir la liste IANA pour les types de médias enregistrés se terminant en +xml.

(Pour les non x- types, tous les paris sont éteints, mais que vous espérer +xml serait respecté.)

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X