Je possède un fichier TXT avec des équations mathématiques LaTeX où un délimiteur $ unique est utilisé avant et après chaque équation en ligne.
J'aimerais trouver chacune des équations dans un paragraphe et remplacer les délimiteurs par des balises XML ouvrantes et fermantes ....
Par exemple,
Le paragraphe suivant:
Ceci est le début d'un paragraphe $première équation$ ...et voici du texte... $deuxième équation$ ...et voici plus de texte... $troisième équation$ ...et voici encore plus de texte... $quatrième équation$
devrait devenir:
Ceci est le début d'un paragraphe première équation ...et voici du texte... deuxième équation ...et voici plus de texte... troisième équation ...et voici encore plus de texte... quatrième équation
J'ai essayé les commandes sed et perl suivantes:
perl -p -e 's/(\$)(.*[^\$])(\$)/$2<\/equation>/'
Mais ces commandes aboutissent à ce que les première et dernière instances d'équations soient converties mais aucune des équations entre celles-ci:
Ceci est le début d'un paragraphe première équation$ ...et voici du texte... $deuxième équation$ ...et voici plus de texte... $troisième équation$ ...et voici encore plus de texte... $quatrième équation
J'aimerais également une solution robuste qui pourrait prendre en compte la présence d'un seul $ qui n'est pas utilisé comme délimiteur LaTeX. Par exemple,
Ceci est le début d'un paragraphe $première équation$ ...et voici du texte qui inclut un seul signe de dollar : Il a payé $2,50 pour un paquet de cigarettes... $deuxième équation$ ...et voici plus de texte... $troisième équation$ ...et voici encore plus de texte... $quatrième équation$
ne devrait pas devenir:
Ceci est le début d'un paragraphe première équation$ ...et voici du texte qui inclut un seul signe de dollar : Il a payé 2,50 pour un paquet de cigarettes... $deuxième équation$ ...et voici plus de texte... $troisième équation$ ...et voici encore plus de texte... $quatrième équation
Remarque: J'écris en Bash.