Comment github calcule-t-il la langue d'un projet?

Question

Comment github calcule-t-il la langue d'un projet?

Demandé el 15 de Mars, 2011: Quand la question a-t-elle été
10712 affichage: Nombre de visites la question a
4 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

Je travaillais récemment sur un projet github en JavaScript et en C ++, et j'ai remarqué que github l'a étiqueté en tant que C ++. Si vous devez choisir une seule langue, il s'agit probablement de la désignation correcte puisque le code C ++ est compilé sous la forme d'une bibliothèque JavaScript, mais cela m'a fait me demander ... comment github détermine-t-il quelle langue marquer chaque projet?

Demandé el 15 de Mars, 2011 par Justin Ethier

Answer 1

4 Réponses

Answer 2

88voto

VonC Points 414372

Mise à jour avril 2013, par nuclearsandwich (GitHub de l'équipe de soutien ou de "supportocat"):

l'aide de la page "Mon référentiel est marqué comme la mauvaise langue" mentionne l'utilisation de maintenant, le linguiste bibliothèque pour déterminer le fichier de langue pour la coloration syntaxique et les pensions de statistiques. Linguiste, d'exclure certains noms de fichiers et de chemins de statistique, à l'exclusion de certains fournisseurs de fichiers et de répertoires.
la page d'aide "Pourquoi n'est pas ma langue préférée reconnu?" ajoute:

Si la langue souhaitée n'est pas la réception de la syntaxe, vous pouvez contribuer à le Linguiste de la bibliothèque de l'ajouter.

(Réponse originale à cette question, Oct. 2012)

Ce thread sur GitHub l'appui , il explique:

Il a juste résume tailles de fichier pour chaque extension. Plus on "gagne".

Nous aimerions éviter l'ouverture de fichiers et l'analyse de leur contenu, à la fois de ralentir le processus... mais qui pourrait être la seule méthode de résolution des conflits comme celui-ci.

Puisque ce n'est pas précis à 100%, qui avait conduit certains à ajouter:

Moi aussi, je voterais pour un manuel simple-bouton du correcteur pour les cas où la conjecture est fausse.

Remarque: comme la Marque de Rushakoff mentionne dans sa réponse (upvoted), la deviner eu mieux depuis avec le linguiste projet (open-source à partir de juin 2011).
Vous pouvez le voir il y a encore des questions: GitHub Linguiste Questions.
Voir ici pour plus de détails:

Une fois que la langue a été détecté, il est passé à Albino, un Pygments wrapper, qui procède à la vérification de la syntaxe.

Répondu el 15 de Mars, 2011 par VonC (414372 Points )

Answer 3

14voto

Mark Rushakoff Points 97350

Actuellement, le projet linguiste de Github est ce qui est utilisé pour déterminer les statistiques linguistiques, comme décrit dans ce blog de Github (publié quelques mois après que cette question a été posée à l'origine).

Répondu el 6 de Avril, 2012 par Mark Rushakoff (97350 Points )

Answer 4

2voto

Steven Penny Points 18523

Après quelques retouches avec linguistej' l'avoir remarqué.

Pour les fichiers avec un Shebang, l'Arborescence n'est pris en compte lors de la détermination de la langue, mais semble être uniformément pondérée contre les autres jetons. Cela semble être une grosse erreur, parce que le Shebang devrait définitivement définir l' la langue de fichier.

Cela peut causer des problèmesavec mise en évidence.

Répondu el 21 de Décembre, 2012 par Steven Penny (18523 Points )

Answer 5

-1voto

Maarten Terpstra Points 208

Les extensions de fichiers sont la première chose qui me vient à l’esprit.

Répondu el 15 de Mars, 2011 par Maarten Terpstra (208 Points )

Comment github calcule-t-il la langue d'un projet?

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

Comment github calcule-t-il la langue d'un projet?

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: