Extraction d'informations spécifiques à partir de données

Question

Extraction d'informations spécifiques à partir de données

Demandé el 8 de Octobre, 2016: Quand la question a-t-elle été
82 affichage: Nombre de visites la question a
2 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

Comment puis-je convertir un format de données tel que :

James Smith was born on November 17, 1948

en quelque chose comme

("James Smith", DOB, "November 17, 1948")

sans avoir à se fier à l'index positionnel des chaînes de caractères

J'ai essayé ce qui suit

from nltk import word_tokenize, pos_tag

new = "James Smith was born on November 17, 1948"
sentences = word_tokenize(new)
sentences = pos_tag(sentences)
grammar = "Chunk: {<NNP*><NNP*>}"
cp = nltk.RegexpParser(grammar)
result = cp.parse(sentences)
print(result)

Comment procéder pour obtenir le résultat dans le format souhaité.

Demandé el 8 de Octobre, 2016 par PepeHands

Answer 1

2 Réponses

Answer 2

1voto

Bhaskara Arani Points 466

Diviser la chaîne avec "est né le" après avoir coupé les espaces et l'assigner au nom et à l'âge.

Répondu el 8 de Octobre, 2016 par Bhaskara Arani (466 Points )

Answer 3

1voto

zawata Points 172

Vous pouvez toujours utiliser des expressions régulières. La regex (\S+)\s(\S+)\s\bwas born on\b\s(\S+)\s(\S+),\s(\S+) correspondra et renverra des données provenant spécifiquement du format de chaîne ci-dessus.

Le voici en action : https://regex101.com/r/W2ykKS/1

Regex en python :

import re

regex = r"(\S+)\s(\S+)\s\bwas born on\b\s(\S+)\s(\S+),\s(\S+)"
test_str = "James Smith was born on November 17, 1948"

matches = re.search(regex, test_str)

# group 0 in a regex is the input string

print(matches.group(1)) # James
print(matches.group(2)) # Smith
print(matches.group(3)) # November
print(matches.group(4)) # 17
print(matches.group(5)) # 1948

Répondu el 8 de Octobre, 2016 par zawata (172 Points )

Extraction d'informations spécifiques à partir de données

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

Extraction d'informations spécifiques à partir de données

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: