J'ai un RegEx qui devrait trouver tous les caractères alphanumériques ou les textes entre crochets comme l'exemple dans le lien ci-dessus. Ces textes sont en fait des liens avec des descriptions (par exemple [[Toto|there's a link here]]
est un lien vers la page Toto
)
Mais le problème est que je pourrais avoir d'autres textes entre crochets et donc, comme vous pouvez le voir dans le lien, il ne reconnaît pas les crochets à la fin ( ]]
).
Il y a aussi un autre motif important dans ces liens, il y a des tuyaux ( |
) qui séparent mes textes en deux ou trois parties. Dans le cas où il y a deux parties, je veux seulement obtenir le texte de gauche et dans le cas où il y a trois parties, je veux obtenir le texte de droite.
Exemple :
[[File:Euclid flowchart 1.png|vignette|[[Flowchart]] of an algorithm ([[Euclid's algorithm]]).]]
Je veux seulement [[Flowchart]] of an algorithm ([[Euclid's algorithm]]).
partie (c'est un png avec une description en dessous et dans cette description il y a d'autres liens)
[[Babylone|Babyloniens]]
Je veux Babylone
Dans le premier exemple, il y a d'autres liens à l'intérieur mais je peux facilement les extraire avec ma première regex ou une récursion.
Vous pouvez voir un exemple de mon code ici