56 votes

Que sont "Microsoft Office Protocol Discovery" et "OfficeLiveConnector" et pourquoi accèdent-ils à des URL invalides ?

Je surveille de près les messages 404 sur mes sites, ce qui m'aide à détecter les liens brisés et les tentatives de piratage, mais j'ai récemment reçu du spam de la part de navigateurs dont l'agent utilisateur contient ces chaînes. Ils semblent essayer d'analyser les répertoires parents de ressources valides, mais les répertoires ont une signification particulière pour mes sites en raison de la réécriture SEO.

Avant de décider de ce que je vais faire, j'aimerais savoir ce que ces UA essaient de faire et pourquoi. S'il ne s'agit que de "bruit", je serais heureux d'interrompre complètement la connexion. Sinon, s'ils font quelque chose d'utile, je pourrais fournir une réponse appropriée.

Je crois que certaines des demandes proviennent de mes clients, je ne peux donc pas faire quelque chose de trop dérangeant, même si j'aimerais le faire.

1 votes

C'est une question intéressante mais il me semble qu'elle serait mieux adaptée à ServerFault.

8 votes

Le code du site web a été entièrement écrit par moi. Toute solution sera sous forme de code. Je ne vois pas cela comme un problème d'administration du serveur.

30voto

bmm6o Points 2692

Microsoft a un article de kb (lien actuellement rompu, Instantané d'Internet Archive ) qui couvre la découverte de protocole dans les moindres détails. Essentiellement, Office essaie de déterminer si votre serveur prend en charge WebDAV (ou quelque chose de similaire) afin que les modifications apportées par l'utilisateur au document Office puissent être répercutées directement sur le serveur.

1 votes

Merci pour le lien. Il semble que le problème soit que mes règles de réécriture transmettent des requêtes OPTIONS à mon application alors qu'elles seraient mieux gérées par Apache. Cela résout le problème de l'Office Protocol Discovery, mais le OfficeLiveConnector fait des requêtes GET, donc ce n'est peut-être pas la même chose.

1 votes

J'ai lu le lien en entier mais je ne sais toujours pas si les demandes de l'UA "Microsoft Office Protocol Discovery" indiquent que l'utilisateur navigue avec IE ou une application Office comme Word. IE est-il une "application Office" ?

5 votes

D'après mon expérience, ils ont téléchargé le document avec un navigateur (pas nécessairement IE) et le navigateur lance le gestionnaire enregistré pour ce type de document. C'est ensuite Office lui-même qui effectue les requêtes supplémentaires. Vous devriez le constater dans vos journaux.

13voto

Frederic Points 502

Sur les serveurs que je dois maintenir, cela semble se produire en raison d'un e-mail html utilisant des images externes hébergées sur nos serveurs.

Il semble que les clients Microsoft Office Outlook, qui utilisent Microsoft Word pour modifier les courriers électroniques (et pour les afficher depuis l'édition 2007), déclenchent ces requêtes "Microsoft Office Protocol Discovery".

Dans mon cas, les sites web sans aucune sorte de contribution en ligne, je vois cela comme un bruit gênant. Si votre site est une sorte de site de partage avec des capacités d'édition de documents, vous pouvez ne pas considérer ces demandes comme un bruit gênant, en fonction de la mise en œuvre de votre site.

6voto

jakobdo Points 76

Cela a marché pour moi :

# Intercept Microsoft Office Protocol Discovery
RewriteCond %{REQUEST_METHOD} ^(OPTIONS|PROPFIND)$ [NC]
RewriteCond %{HTTP_USER_AGENT} ^Microsoft\ Office\ Protocol\ Discovery [OR]
RewriteCond %{HTTP_USER_AGENT} ^Microsoft\ Office\ Existence\ Discovery [OR]
RewriteCond %{HTTP_USER_AGENT} ^Microsoft\-WebDAV\-MiniRedir.*$
RewriteRule .* - [R=501,L]

6voto

Tom Parsons Points 61

Je suppose que votre site sert occasionnellement des documents Office - c'est ce qui est à l'origine de ce problème normalement. Vous pouvez probablement éviter les appels en disant au bureau de ne pas se donner la peine de chercher à savoir si des économies sont possibles.

Pour ce faire, il suffit de modifier l'en-tête Content-Disposition dans le document bureautique servi. J'ai rencontré ce problème lorsqu'il était réglé sur :

Content-Disposition=inline; filename="<my file name>"

En le changeant en pièce jointe, les appels ont été évités :

Content-Disposition=Attachment; filename="<my file name>"

5voto

Steve Jones Points 537

J'héberge un site web ordinaire, non WebDAV, non SharePoint. En raison de la découverte du protocole Microsoft Office, je vois de nombreuses erreurs dues à l'échec des requêtes dans mes fichiers journaux. Pour les éliminer, je recommande de désactiver les requêtes de type WebDAV en désactivant les méthodes HTTP qu'elles utilisent, à commencer par OPTIONS. Cela renforce également la sécurité en évitant certaines attaques HTTP .

J'utilise Apache 2.4, je recommande ce qui suit dans httpd.conf :

<Location />
    # block HTTP methods: OPTIONS PUT DELETE TRACE CONNECT PATCH
    AllowMethods GET POST HEAD
</Location>

Voir la référence Apache 2.4

11 votes

Attention, ces verbes ont d'autres usages que WebDav. Une API de repos nécessite la plupart d'entre eux. CORS nécessite OPTIONS verb. (Un site fournissant du contenu aux pages d'autres sites (par ajax) doit prendre en charge CORS).

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X