Que dois-je utiliser pour ouvrir une url au lieu de urlopen dans urllib3 ?

Question

Que dois-je utiliser pour ouvrir une url au lieu de urlopen dans urllib3 ?

Demandé el 9 de Avril, 2016: Quand la question a-t-elle été
53150 affichage: Nombre de visites la question a
5 Réponses: Nombre de réponses aux questions
Ouvert: Situation réelle de la question

Je voulais écrire un morceau de code comme le suivant :

from bs4 import BeautifulSoup
import urllib2

url = 'http://www.thefamouspeople.com/singers.php'
html = urllib2.urlopen(url)
soup = BeautifulSoup(html)

Mais j'ai découvert que je dois installer urllib3 paquet maintenant.

De plus, je n'ai trouvé aucun tutoriel ou exemple permettant de comprendre comment réécrire le code ci-dessus, par exemple, urllib3 n'a pas urlopen .

Une explication ou un exemple, s'il vous plaît !

P/S : J'utilise python 3.4.

Demandé el 9 de Avril, 2016 par niloofar

2 votes

Pourquoi faut-il installer urllib3 alors que l'exemple fonctionne ?

Commenté el 9 de Avril, 2016 par Deusdeorum

1 votes

Parce que ça ne fonctionne pas pour moi, pas d'urllib2 trouvé.

Commenté el 9 de Avril, 2016 par niloofar

2 votes

@niloofar Python 3.4 a urllib2 nommé comme urllib. from urllib import urlopen devrait fonctionner dans ce cas.

Commenté el 25 de Octobre, 2016 par Manuel Gutierrez

Afficher 1 autres commentaires

Answer 1

5 Réponses

Answer 2

55voto

shazow Points 1021

Urllib3 est une bibliothèque différente de urllib et urllib2. Elle possède beaucoup de fonctionnalités supplémentaires par rapport aux urllib de la bibliothèque standard, si vous en avez besoin, des choses comme la réutilisation des connexions. La documentation est ici : https://urllib3.readthedocs.org/

Si vous souhaitez utiliser urllib3, vous devrez pip install urllib3 . Un exemple de base ressemble à ceci :

from bs4 import BeautifulSoup
import urllib3

http = urllib3.PoolManager()

url = 'http://www.thefamouspeople.com/singers.php'
response = http.request('GET', url)
soup = BeautifulSoup(response.data)

Répondu el 9 de Avril, 2016 par shazow (1021 Points )

0 votes

response.read() ne fonctionne pas, du moins dans Python 2.7. Selon la documentation urllib3.readthedocs.io/fr/latest/guide-utilisateur.html il devrait l'être html = response.data .

Commenté el 12 de Février, 2017 par RajeshM

0 votes

Cet exemple me donne une erreur d'exception (urllib3.exceptions.MaxRetryError) python3

Commenté el 20 de Juin, 2021 par Armin

Answer 3

39voto

alecxe Points 50783

Vous ne devez pas installer urllib3 . Vous pouvez choisir n'importe quelle bibliothèque de création de requêtes HTTP qui correspond à vos besoins et envoyer la réponse à BeautifulSoup . Le choix est cependant généralement requests en raison de la richesse de ses fonctionnalités et de son API pratique. Vous pouvez installer requests en entrant pip install requests dans la ligne de commande. Voici un exemple de base :

from bs4 import BeautifulSoup
import requests

url = "url"
response = requests.get(url)

soup = BeautifulSoup(response.content, "html.parser")

Répondu el 9 de Avril, 2016 par alecxe (50783 Points )

1 votes

Pour info, vous devez toujours installer requests si vous souhaitez utiliser les requêtes. Aucun d'entre eux n'est fourni en natif avec Python.

Commenté el 9 de Avril, 2016 par shazow

2 votes

Les demandes dépendent de urllib3.

Commenté el 27 de Juillet, 2018 par Cees Timmerman

0 votes

@CeesTimmerman J'ai essayé des requêtes sans urlib3 et ça marche, pourquoi ça dépend d'urllib3 ?

Commenté el 20 de Juin, 2021 par Armin

Answer 4

11voto

Lan Vukušič Points 25

Le nouveau urllib3 a une bonne documentation aquí
Afin d'obtenir le résultat souhaité, vous devez suivre ces instructions :

Import urllib3
from bs4 import BeautifulSoup

url = 'http://www.thefamouspeople.com/singers.php'

http = urllib3.PoolManager()
response = http.request('GET', url)
soup = BeautifulSoup(response.data.decode('utf-8'))

La partie "decode utf-8" est optionnelle. Cela a fonctionné sans elle quand j'ai essayé, mais j'ai quand même mis l'option en ligne.
Source : Guide de l'utilisateur

Répondu el 7 de Novembre, 2017 par Lan Vukušič (25 Points )

0 votes

Demande simplement l'utilisation d'urllib3 en coulisses

Commenté el 10 de Avril, 2018 par PirateApp

1 votes

@PirateApp C'est le cas.

Commenté el 13 de Janvier, 2019 par Cole

Answer 5

0voto

emehex Points 2250

Con gazpacho vous pourriez transformer la page directement en un objet de soupe analysable :

from gazpacho import Soup
url = "http://www.thefamouspeople.com/singers.php"
soup = Soup.get(url)

Et faire des trouvailles par-dessus le marché :

soup.find("div")

Répondu el 9 de Octobre, 2020 par emehex (2250 Points )

Answer 6

0voto

Heba Hashim Points 61

Dans urlip3, il n'y a pas de .urlopen essayez plutôt ceci :

import requests
html = requests.get(url)

Répondu el 10 de Janvier, 2021 par Heba Hashim (61 Points )

Que dois-je utiliser pour ouvrir une url au lieu de urlopen dans urllib3 ?

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

Que dois-je utiliser pour ouvrir une url au lieu de urlopen dans urllib3 ?

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: