Ce code ouvre l'URL et ajoute l'élément /names
à la fin, ouvre la page et imprime la chaîne à l'adresse test1.csv
:
import urllib2
import re
import csv
url = ("http://www.example.com")
bios = [u'/name1', u'/name2', u'/name3']
csvwriter = csv.writer(open("/test1.csv", "a"))
for l in bios:
OpenThisLink = url + l
response = urllib2.urlopen(OpenThisLink)
html = response.read()
item = re.search('(JD)(.*?)(\d+)', html)
if item:
JD = item.group()
csvwriter.writerow(JD)
else:
NoJD = "NoJD"
csvwriter.writerow(NoJD)
Mais j'obtiens ce résultat :
J,D,",", ,C,o,l,u,m,b,i,a, ,L,a,w, ,S,c,h,o,o,l,....
Si je remplace la chaîne par ("JD", "Columbia Law School" ....), j'obtiens alors
JD, Columbia Law School...)
Je n'ai pas trouvé dans la documentation comment spécifier le délimiteur.
Si j'essaie d'utiliser delimeter
J'obtiens cette erreur :
TypeError: 'delimeter' is an invalid keyword argument for this function