Grafisk figur Instructable visningar med Python skärmen skrapa (2 / 6 steg)
Steg 2: Översikt och Installation
Det finns en massa olika filer inblandade i detta projekt. Jag har zippade tillsammans en arbetsminnet och laddade upp dem här. Att installera hämta dem, och packa upp allt i en katalog. Jag har också lagt upp några filer utan att zippa. Avsikten är att du klickar på dem och läsa utan att ladda ner, de ingår i zip-filen, och inte behöver laddas ner separat. (också ziped filerna kan vara lite mer uppdaterad)
Du kommer att behöva installera Python om det inte redan är installerad. Webben är full av information om detta. På Pi är Python förinstallerat. På datorn rekommenderar jag den grundläggande Python för människor utan mycket erfarenhet i programmering och Spyder (från http://docs.continuum.io/anaconda/ ) för dig som är erfaren.
Om du vill använda program rekommenderar jag att du kör dem först från en utvecklingsmiljö, och arbeta för att köra dem från en file manager eller Desktopen ikonen senare. I dessa riktningar antar jag du arbetar från en utvecklingsmiljö som Spyder. Några steg beror på du OS och andra system detaljer. Jag kommer bara adress Windows i detta dokument.
Mycket av förklaringen av programmen är i de kommentarer som jag inte kommer att försöka dra texten från dem i kroppen av den instructable, klicka och läs dem: det är där mycket av instructable innehållet är.
Program här är starkt beroende av mathplotlib, och kan kräva andra Python extensions ( Sypder innehåller nästan alla av detta som standard, så är en bra installationsval)
Hur det fungerar
Python program scrape_views.py samlar in uppgifter från instructables och placerar det i textfiler för senare grafräknare. Detta styrs av en fil som heter urllist.txt , url (och vissa andra uppgifter) webbplatser skrapas. Programmet scrape_views.py måste köras på vissa regelbundet att förvärva data för grafritande programmet, graph_views.py.
Det andra programmet, graph_views.py, läser textfiler med data och diagram data (och sparar eventuellt diagrammen till png -filer). Kontroll av den grafritande är igen via urllist.txt. För närvarande finns det 3 olika stilar av grafer, Läs filer graph_views.py, och urllist.txt för mer info.
Program använda Python konsolen för utgång hålla koll på det.
Jag har tagit en uppsättning filer som innehåller data från några av Instructables mest visade ämnen. Du kan hålla olika inställningar i olika kataloger för skrapning olika uppsättningar av sidor.
Det finns loggfil: views.log
För viss valfri kontroll över kommandoraden program kan argument ingå. Titta på kommandofiler, i avsnittet program som bearbetar kommandoraden ( get_args() ), och längst ner på varje *.py fil för fler kommentarer.