Si le scénario est le suivant:
J'ai plusieurs instances d'un service web qui écrit un tas de données pour le Stockage Azure. J'ai besoin d'être capable de groupe de blobs dans un récipient (ou un répertoire virtuel) selon le moment où il a été reçu. De temps en temps (tous les jours au pire) âgés gouttes obtiendrez traitées, puis supprimé.
J'ai deux options:
Option 1
Je fais un conteneur appelé "blobs" (par exemple) et ensuite le stocker tous les blogs en ce conteneur. Chaque blob utiliser un répertoire de nom de style avec le nom du répertoire en cours du moment il a été reçu (par exemple, "hr0min0/données.bin", "hr0min0/data2.bin", "hr0min30/data3.bin", "hr1min45/données.bin", ... , "hr23min0/dataN.bin", etc - un nouveau répertoire toutes les X minutes). La chose qui traite de ces gouttes traitera hr0min0 gouttes d'abord, puis hr0minX et ainsi de suite (et les gouttes sont encore en cours d'écriture lorsqu'en cours de traitement).
Option 2
J'ai beaucoup de conteneurs, chacun avec un nom basé sur l'heure d'arrivée (donc, la première sera un conteneur appelé blobs_hr0min0 puis blobs_hr0minX, etc) et toutes les gouttes dans le récipient sont ces gouttes qui est arrivé à l'nommé temps. La chose qui traite de ces blogs traitera d'un conteneur à un moment.
Donc ma question est, quelle est la meilleure option? Ne l'option 2 me donner une meilleure parallélisation (depuis les conteneurs peuvent être dans différents serveurs) ou est l'option 1 mieux parce que plusieurs conteneurs peuvent causer d'autres inconnus?