Felaktiga Data: Waterjet etsning datamängder (4 / 13 steg)
Steg 4: Hitta Data
Detta var roligt delen, som omfattade timmar av internet forskning under loppet av ett par månader. Till skillnad från verktygen shop, medan du gör internet forskning kan du dricka whiskey! Detta hjälpte med slit av siktning genom datamängder.
Jag skurade genom data på GitHub repos, offentliga webbplatser, genom personliga kontakter och mycket mer. Några av "dåliga data" verkade alltför lokaliserade (som San Antonion sprit försäljningen), medan andra tycktes mer meningsfullt som lokaler för alla amerikanska fängelser i världen.
De sista tolv datauppsättningarna "dåliga" Jag valde var):
* 2015 Airbnb listor i San Francisco (Källa: darkanddifficult.com)
* Meth Labs i Albuquerque (Källa: http://www.metromapper.org)
* USA: S fängelser (Källa: fängelse politiska initiativ. prisonpolicy.org)
* U.S. massa Skottlossningarna (1982-2012) (Källa: Mother Jones)
* Svartlistade IP-adresser (Källa: Suricata SSL Blacklist)
* Internet personuppgiftsöverträdelser (Källa: http://www.informationisbeautiful.net/)
* Hela världen UFO-observationer (Källa: nationella UFO Reporting Center (NUFORC))
* Världen över hemsökta platser (Källa: Wikipedia)
* Missouri abort alternativ (Källa: data.gov (USA))
* San Francisco vräkningar 18 år (Källa: The anti vräkning Mapping Project och San Francisco hyra Board)
* Södra Kalifornien Starbucks (Källa: https://github.com/ali-ce)
* Denver Marijuana apotek (Källa: Denver öppen Data Portal)