3 votes

Détection des fichiers musicaux en double

J'ai deux répertoires contenant ~20 Go de fichiers musicaux (principalement des mp3, quelques ogg), et je voudrais détecter toutes les chansons en double. Il y a deux facteurs de complication :

  1. Une chanson peut avoir des noms de fichiers différents dans les deux répertoires.
  2. Deux fichiers contenant la même chanson peuvent avoir des étiquettes ID3 différentes et donc des sommes de contrôle différentes.

Quelle est une bonne approche pour résoudre ce problème ?

4voto

Affable Geek Points 233

La façon dont j'ai procédé dans le passé est d'utiliser des génuides qui proviennent de Music IP. Ce logiciel fermé crée une empreinte audio d'un fichier, quel que soit le format, l'id3, la somme de contrôle, etc.

Vous trouverez de plus amples informations aquí .

Cela devrait permettre d'obtenir le plus grand nombre de doublons positifs et de minimiser les faux positifs. Il peut également marquer correctement les balises id3 incorrectes.

2voto

mauriciopastrana Points 1629

Voici ce que je ferais (ou ce que j'ai déjà fait)...

  1. Chargez toutes les chansons sur itunes (soyez indulgent avec moi) (note, si vous pouvez utiliser itunes ici, alors arrêtez ... Je suppose que votre liste de doublons est longue et ingérable)
  2. Supprimez toutes les chansons, en les envoyant à la poubelle, de cette façon vous vous débarrassez de la structure du répertoire
  3. Évidemment, ne "videz pas la corbeille". Sauvegardez les chansons dans un dossier sur votre bureau
  4. Utilisez un logiciel comme mediamonkey , dupe eliminato r ou même itunes lui-même pour identifier les doublons. Dupe eliminator est bon en ce sens qu'il vérifie un certain nombre de facteurs (artiste, longueur, taille des fichiers, etc.) et devine ce qui est un double et ce qui ne l'est pas.
  5. Rechargez dans Itunes, cette fois-ci cochez "Auto arranger les chansons", ce qui fera apparaître votre nouvelle liste sans doublon dans un bel arrangement par artiste et par album.

... voilà (ou si vous lisez digg : "...profit !")

/mp

1voto

Oli Points 65050

Les métatags ID3/OGG-equiv des artistes et des chansons sont-ils exacts ? S'ils le sont, vous pouvez les utiliser.

Edit : Si ce n'est pas le cas, peut-être qu'on pourrait le faire... Si vous ne traitez que des albums entiers, il existe plusieurs outils qui récupèrent toutes les données des tags en fonction du nombre de pistes et de leur longueur.

Si vous avez affaire à des mélanges d'albums et à des fichiers uniques, les choses se compliquent.

1voto

Aaron Maenpaa Points 39173

Si vous disposez d'une bibliothèque capable d'analyser les fichiers, vous pouvez exécuter le hachage sur les données audio. Cela ne vous aidera pas si la chanson est un rip différent ou a été recompressée/transcodée/etc.

1voto

Mark Brackett Points 46824

Je suis sûr qu'il existe des solutions plus élégantes, mais si les données audio sont équivalentes, la suppression des balises ID3 et le hachage devraient suffire. Après le hachage, vous pouvez remettre les balises ID3 si vous le souhaitez.

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X