Quelle est la meilleure façon (la plus efficace) d'analyser un fichier délimité par des tabulations dans Ruby?
Réponses
Trop de publicités?Les règles de TSV sont en réalité un peu différente de CSV. La principale différence est que le CSV a des dispositions pour coller une virgule à l'intérieur d'un champ, puis en utilisant la citation de caractères et d'échapper les guillemets à l'intérieur d'un champ. J'ai écrit un rapide résumé de montrer comment la simple réponse échoue.
https://gist.github.com/hqmq/5460684
Si vous souhaitez utiliser le CSV bibliothèque, vous pouvez utiliser une citation aléatoire de caractères que vous ne vous attendez pas à voir si votre fichier (l'exemple de gist le démontre), mais vous pouvez également utiliser une méthode plus simple comme le StrictTsv de classe dans les gist pour obtenir le même effet sans avoir à vous soucier de champ de citations.
Le choix de l'utilisation de la CSV bibliothèque ou quelque chose de plus strict, tout dépend de qui est à vous envoyer le fichier et qu'ils s'attendent à respecter strictement les TSV standard.
Liens vers le TSV standard: