Spidering en Ajax hemsida med en asynkron inloggningsformuläret (3 / 6 steg)
Steg 3: Förbereda koden
Innan vi lägger till skapa de nya headers vi har hittat låt oss ett mallbaserat Mechanize login python kod. Vi gör detta av två skäl, först så vi har en komponent som arbetar för att lägga till nya grejer till och för det andra så ser du hur du skulle normalt logga in till en icke AJAX-y webbsida.Öppna Anteckningar eller motsvarande, och kopiera och klistra in följande. När du är klar spara den som youfilename.py någonstans du kan hitta.
#! / usr/bin/python
#-*-kodning: utf-8-*-
#Start med din modul import:
mechanize importera webbläsare
#Create din webbläsare instans genom funktionen Browser() kallar;
br = Browser()
#Set webbläsare så att den ignorerar spiders.txt begär
#Do detta noga, om webbsidan inte gillar spindlar, kan de bli upprörd att hitta du det
br.set_handle_robots(false)
#Open sidan som du vill logga in på
br.Open ("https://pubmatic.com/04_betasignin.jsp")
#Because jag vet formulärnamnet, jag kan helt enkelt välja form av namnet
br.select_form("login")
#Using namnen av formelement I-ingång namnen på formelement
br ['email'] = "laser + pubmatic
br ['lösenord'] = "Asquid22"
#br.submit() skickar ut formuläret och drar sidan, du skapar en ny instans av webbläsaren
#response nedan innehåller sidan som
svar = br.submit()
#This kommer att skrivas ut kroppen på webbsidan så fick
#print response.read()