Lecture binaire des documents Word serait la création d'un analyseur selon la publication de spécifications de format de fichier pour le format DOC. Je pense que ce n'est pas vraiment réalisable.
Vous pouvez utiliser le Microsoft Office XML formats pour la lecture et l'écriture des fichiers de mots - ce qui est compatible avec l'2003 et la version 2007 de Word. Pour la lecture, vous devez garantir que les documents Word sont enregistrées dans le format correct (il est appelé XML Word 2003-Document dans Word 2007). Pour l'écriture, vous avez juste à suivre le ouvertement disponibles schéma XML. Je n'ai jamais utilisé ce format pour écrire des documents Office à partir de PHP, mais je l'utilise pour la lecture dans une feuille de calcul Excel (naturellement enregistrées au format XML-feuille de calcul 2003) et l'affichage de ses données sur une page web. Comme les fichiers sont clairement des données XML, il n'est pas un problème pour naviguer à l'intérieur et à comprendre comment l'extraire les données dont vous avez besoin.
L'autre option - Word 2007, seule option (si l'OpenXML formats de fichiers ne sont pas installés dans votre Word 2003) - serait à ressort à OpenXML. Comme databyss souligné ici le format de fichier DOCX est juste une archive ZIP avec des fichiers XML inclus. Il y a beaucoup de ressources sur MSDN concernant le fichier OpenXML format, donc vous devriez être en mesure de comprendre comment lire les données que vous souhaitez. L'écriture sera beaucoup plus compliqué, je pense juste que cela dépend de la façon dont beaucoup de temps vous allez investir.
Peut-être vous pouvez avoir un coup d'oeil à PHPExcel qui est une bibliothèque en mesure d'écrire dans des fichiers Excel 2007 et lire à partir de fichiers Excel 2007 à l'aide de l'OpenXML standard. Vous pourriez avoir une idée du travail en essayant de lire et d'écrire OpenXML des documents Word.