Je cherche à mettre en place mon propre script simple de statistiques web.
Le seul obstacle majeur sur la route, pour autant que je sache, est de distinguer les visiteurs humains des robots. J'aimerais avoir une solution pour cela que je n'ai pas besoin de maintenir régulièrement (c'est-à-dire que je ne veux pas mettre à jour des fichiers texte avec des User-agents liés à des robots).
Existe-t-il un service ouvert qui fait cela, comme Akismet le fait pour le spam ? Ou existe-t-il un projet PHP qui se consacre à la reconnaissance des araignées et des robots et qui fournit des mises à jour fréquentes ?
Pour clarifier : Je ne cherche pas à bloquer les bots. Je n'ai pas besoin de résultats 100% étanches . Je veux juste Je veux juste en exclure le plus possible de mes statistiques. Sur savons que l'analyse de l'agent utilisateur est une option mais maintenir les modèles à pour l'analyse syntaxique représente beaucoup de travail. Ma question question est de savoir s'il existe un projet ou service qui le fait déjà.
Une prime : J'ai pensé que je pourrais pousser ceci comme une question de référence sur le sujet. La meilleure contribution / la plus originale / la plus techniquement viable recevra le montant de la prime.
0 votes
Je peux vous demander pourquoi vous voulez faire le vôtre ? Cela peut ajouter une grande quantité de stress supplémentaire à vos serveurs (write ops). Qu'est-ce que GA ne peut pas suivre pour vous ?
0 votes
@galambalazs Je ne veux pas utiliser GA dans ce scénario. L'objectif est d'avoir une solution complètement autonome.
0 votes
Je comprends ce que votre objectif est. Je suis juste curieux de savoir pourquoi ? :)
1 votes
@galambalasz le site pour lequel je veux faire cela est destiné à un groupe de personnes qui n'ont pas un esprit très technique. GA avec ses milliers de cloches et de sifflets est trop compliqué pour eux. Ce qu'ils ont besoin de savoir est 1) le nombre total de visiteurs de la journée et 2) une liste d'où ils viennent approximativement. Je pense qu'il y a une demande pour des solutions aussi simples que celle de GA, qui n'y répond pas, simplement parce qu'elle est si compliquée. complexe . Cependant, avec le GA API il est désormais possible d'extraire et d'afficher des données de manière personnalisée.
1 votes
Donc l'argument n'est plus aussi valable qu'il ne l'était lorsque j'ai posé la question. Mais même en dehors de cela, j'ai parfois le désir de réduire la dépendance vis-à-vis des fournisseurs tiers, en particulier pour les projets qui ne feront pas l'objet d'un développement et d'une maintenance techniques fréquents. Il y a des choses qui peuvent mal tourner avec un service hébergé pannes techniques les changements de licence possibles, la faillite... Tout cela est arrivé, même pour les plus grandes et les plus puissantes des entreprises.
0 votes
Voulez-vous recueillir des statistiques par le biais d'un moyen de s'accrocher à la vue de la page (JS à la Google Analytics, ou png invisible 1x1 pixel compteur de hits) ou en traitant vos journaux de serveur hors ligne après le fait ? Ou l'un ou l'autre ?