Gå till innehåll
Just nu i M3-nätverket

Läsa en websida med python


treebeard

Rekommendera Poster

Hej.

Jag tänkte att det skulle vara kul att läsa ut åldersfördelning på atleterna på OS (som en övning med python). Tyvärr tog det slut redan i första steget, att läsa in www.london2012.com eller någon undersida.

 

Jag använder följande kod:

import urllib.request

url = r'http://www.london2012.com/'

html = urllib.request.urlopen(url).read()
print(html)

Jag har testat att byta ut url mot andra websidor och då fungerar allt som förväntat, men just den sida jag vill komma åt ger följande felmeddelande (samt bortklipt traceback):

raise HTTPError(req.full_url, code, msg, hdrs, fp)
urllib.error.HTTPError: HTTP Error 403: Forbidden

 

Nu till min fråga.

Är just OS-sidan blockerad för sådana här försök av åtkomst?

Går det göra på något annat sätt för att komma åt den information jag vill ha?

 

Jag har Python 3.2.3 i windows. Jag har även testat liknande kod i Python 2.7.2 på mac, med liknande resultat.

Länk till kommentar
Dela på andra webbplatser

Arkiverat

Det här ämnet är nu arkiverat och är stängt för ytterligare svar.



×
×
  • Skapa nytt...