Je suis impuissant sur les expressions régulières donc s'il vous plaît aidez-moi sur ce problème.
En gros, je télécharge des pages web et des flux rss et je veux tout enlever sauf les mots simples. Pas de points, de virgules, de "si", de "et", de "mais". Littéralement, j'ai une liste des mots les plus courants utilisés en anglais et je veux aussi les dépouiller, mais je pense savoir comment faire et ne pas avoir besoin d'une expression régulière parce que ce serait vraiment trop long.
Comment supprimer tout ce qui se trouve dans un morceau de texte, sauf les mots délimités par des espaces ? Tout le reste va à la poubelle.
Cela fonctionne très bien grâce à Pavel .split(/[^[:alpha:]]/).uniq!