Il m'arrive de travailler avec des fichiers texte dans lesquels certaines sections comportent plusieurs paragraphes ayant la même structure. En voici un exemple :
Some unrelated preface I'm not interested in... Lorem ipsum dolor sit amet,
consectetur adipiscing elit. Etiam scelerisque.
Lorem ipsum dolor sit amet, consectetur adipiscing elit.
Etiam scelerisque. Lorem ipsum dolor sit amet, consectetur adipiscing elit. Etiam scelerisque.
001 [SomeTitle 1] - Some Subtitle 1
Name: SomeName
Area: SomeArea
Content: Some multi-line comment...Lorem ipsum dolor sit amet, consectetur
adipiscing elit. Etiam scelerisque. Lorem ipsum dolor sit amet,
consectetur adipiscing elit. Etiam scelerisque.
002 [SomeTitle 2] - Some Subtitle 2
Name: SomeOtherName
Area: SomeOtherArea
Content: Some other multi-line comment...Lorem ipsum dolor sit amet, consectetur
adipiscing elit.
Je cherche un moyen simple d'interroger des fichiers de ce type. Par exemple, si je recherche "Area:SomeOtherArea", le résultat devrait être tous les blocs du fichier contenant cette zone. Je veux dire les quatre paragraphes : En-tête, Nom, Zone, Contenu. Je pourrais utiliser grep avec les options -A et -B, mais le problème est que les paragraphes de contenu peuvent être composés d'un nombre quelconque de lignes. Et ce n'est que cet exemple spécifique ; la structure pourrait être complètement différente.
Je recherche une solution légère et facilement adaptable, peut-être une combinaison d'outils CLI. Je ne veux pas réinventer la roue.