3 votes

Impossible de récupérer le texte de la balise SPAN

La structure du site web que j'essaie d'analyser ressemble à ceci :

<table border="0" cellpadding="3" cellspacing="0" width="100%">
    <tr height="25">
        <td class="th" style="border:none" width="2%"> </td>
        <td class="th">movie</td>
        <td class="th"> </td>
        <td class="th"> </td>
    </tr>

    <tr id="place_1">
        <td style="color: #555; vertical-align: top; padding: 6px">
            <a name="1"></a>1.
        </td>

        <td style="height: 27px; vertical-align: middle; padding: 6px 30px 6px 0">
            <a class="all" href="stackoverflow.com/326/">MOVIE TITLE IN SPANISH</a>

            <br/>

            <span class="text-grey">MOVIE TITLE IN ENGLISH</span> 
        </td>

        <td style="width: 85px">
            <div style="width: 85px; position: relative">
                <a class="continue" href="stackoverflow.com/326/votes/">
                    9.191
                </a> 

                <span style="color: #777">
                    (592 184)
                </span>
            </div>
        </td>
    </tr>

    ...
    ...
    ...

Le problème est que je n'arrive pas à faire entrer le texte dans le span-tag. J'ai essayé .texte comme pour a-tag, également essayé .get_text() . Mais rien de tout cela n'a fonctionné. Mon code sur Python :

for row in table.find_all('tr')[1:]:

    info = row.find_all('td')

    movies.append({
        'spn_title' : info[1].a.text,
        'eng_title' : info[1].span.text,
    })

Les erreurs que je reçois :

AttributeError : L'objet 'NoneType' ne possède pas d'attribut 'get_text'.

ou

eng_title' : info[1].span.text AttributeError : L'objet 'NoneType' n'a pas d'attribut. aucun attribut 'text'.

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X