Grafisk figur Instructable visningar med Python skärmen skrapa (5 / 6 steg)
Steg 5: Setup för skrapning andra sidor
Programmet är uppbyggt så att du kan ha en eller flera uppsättningar av sidor att skrapa i underkataloger till katalogen där du *.py program är (jag kallar detta pyscrape ). Programmet fungerar som hämtade direkt ur pyscrape. Om du vill kan du ändra filerna (framför allt urllist.txt ) för att skrapa andra sidor, men om du röra till det hela tining slutar att fungera. I stället inrättas en sub katalog säga mypages. Då har du pyscrape\mypages. Kopiera alla .txt filer över till den katalogen. Köra .py program med kommandoraden argument mypages, och du bör börja behandla ur katalogen. Du kan sedan ändra mypages för vad någonsin sidor du vill ha. Ytterligare uppsättningar av sidor kan skapas i ytterligare underkataloger. Den .bat arkivera är inställda för denna typ av behandling, de är för min katalog setup de kommer att behöva ändras för att fungera för dig.