Spidering en Ajax hemsida med en asynkron inloggningsformuläret
Detta instructable visar dig hur logga in via ett AJAX formulär med hjälp av Python och en modul som kallas Mechanize.
Spindlar är web automation program som blir allt mer populärt sätt för människor att samla data online. De kryper runt på webben samlar dyrbara material för att underblåsa de mest kraftfulla web företag runt. Andra krypa runt och samla in specifika uppsättningar med data för att förbättra beslutsfattandet, eller dra slutsatser om vad som för närvarande "i", eller hitta de billigaste vägarna.
Spindlar (sökrobotar, webbots eller skärmen skrapor) är bra för att förvandla HTML goop till ett visst sken av intelligent data, men vi har ett problem när det gäller AJAX aktiverade webbsidor som har JavaScript och cookies aktiverat sessioner som inte är farbar med normal uppsättning spidering verktyg. I detta instructable vi kommer att tillgång till vår egen medlem sida på pubmatic.com. Dessa steg kommer att visa dig en metod att följa, men din sida kommer att vara annorlunda.
Ha det så kul!