Nous sommes dans l'évaluation des nouvelles technologies que nous allons utiliser pour stocker les données que nous avons recueillies lors de l'analyse de code C/C++. Dans le cas de C++, la quantité de données peut être relativement importante, ~20 mo par TU.
Après la lecture de ce qui suit AFIN de répondre , il m'a fait envisager que HDF5 pourrait être une technologie appropriée pour l'utiliser. Je me demandais si des gens ici pourrait m'aider à répondre à quelques questions que j'ai:
Les performances. L'utilisation générale pour les données seront écrire une fois et lire les "plusieurs" fois, semblable à la durée de vie d'une '.o' fichier généré par un compilateur. Comment HDF5 comparer à l'aide de quelque chose comme un DB SQLite? C'est que même une comparaison raisonnable à faire?
Au fil du temps, nous allons ajouter les informations qui nous sont le stockage, mais n'ont pas forcément envie de re-distribuer un tout nouveau jeu de "lecteurs" à l'appui d'un nouveau format. Après la lecture du guide de l'utilisateur-je comprendre que HDF5 est similaire à XML ou d'un DB, en ce que l'information est associée à une balise/colonne et donc un outil intégré pour lire une ancienne structure va simplement ignorer les champs qu'il n'est pas concerné avec? Est ma compréhension sur ce correct?
Une partie importante de l'information que l'on souhaite écrire une arborescence type de structure: champ d'application de la hiérarchie, la hiérarchie des types de etc. Idéalement, nous aurions modèle étendues comme avoir des parents, des enfants, etc. Est-il possible d'avoir un HDF5 objet "point" à l'autre? Si non, est-il une norme technique pour résoudre ce problème à l'aide de HDF5? Ou, comme il est requis dans une DB, n'avons-nous besoin d'une clé unique qui serait "lien" un objet à l'autre avec des recherches appropriées lors de la recherche pour les données?
Merci beaucoup!