Twitter Mood Light - världens humör i en låda (5 / 13 steg)
Steg 5: Att välja bra söktermer
Twitter kan du söka efter de senaste tweets som innehåller särskilda ord eller meningar.
Du kan söka efter tweets som innehåller någon av en lista av fraser med hjälp av den "+ OR +" tillsammans.
Här är exempelvis en sökbegäran som kan hitta tweets att uttrycka rädslan:
GET /search.json?q="i'm+so+scared"+OR+"i'm+really+scared"+OR+"i'm+terrified"+OR+"i'm+really+afraid"+OR+"so+scared+i" & rpp = 30 & result_type = de senaste
Jag tillbringade en lång tid att hitta bra sökfraser.
Sökfraser som behövs för att producera tweets som:
- mycket uttrycker ofta önskad känslor.
- mycket sällan uttrycker motsatta känslor eller inga känslor.
Många sökfraser som jag trodde skulle fungera, visade sig inte fungera som väl när jag sökte med dem.
Smileys har använts med viss framgång för att extrahera om meningen är positivt eller negativt, men jag hittade inte dem användbara för extrahering av något mer.
Problemet med smileys är att ett leende kan betyda så många saker ;D
Den används ofta, det verkar som ett slags kvalificerare för hela meningen; eftersom människor har att komprimera sina tankar till 140 tecken, kan enligt bli tvetydig.
Smiley agerar ofta då som ett kval som:
- "Detta är en trevlig kommentar"
- "ta inte detta på fel sätt"
- "jag säger Hej/hejdå med ett leende"
- "Detta är nästan ett skämt"
- "Jag vet jag är Uppnosig"
- "Jag verkligen menar inte detta"
Fraser med adverb tycktes ger bättre resultat.
"så rädd" eller "jätterädd" är bättre än bara "rädd" som returnerar dåliga resultat: till exempel "inte rädd".
Fraser i första person tycktes ger bättre resultat.
Några sökfraser ge tweets som föreslår författaren känns känslor: "Jag hatar verkligen...", till exempel ofta låter som de verkligen är full av hat eller arg, medan andra fraser som innehåller ordet "hat" ge tweets som inte verkar uttrycker mycket känslor, som "Varför hatar du..."
Överdrift är din bästa vän, någonsin:
Använda fraser med överdrift gav bra resultat. Tweets med "Jag är livrädd" eller "Jag är förstenad" i dem var generellt mer skrämmande klingande än "Jag är rädd"
Oavsett, det är fortfarande naiv, men statistiskt, från mina tester, det verkar fungera bra.
Medan testa koden, jag vid ett tillfälle fick fruktansvärt olycksbådande "blinkande vitt" som betyder världen känner intensiv rädsla, men eftersom jag var fortfarande testa allt, jag dolde inte under tabellen direkt, men istället kastade försiktighet till vinden och gick på Twitter att se vad det var plötsligt så rädd om.
Senaste tweets som innehåller rädslan söksträng (se sidan) till stor del om ett stort åskväder som just börjat någonstans nära Florida.
Om du är intresserad, är här några av de tweets:
- "Ahhh Thunder jag är så rädd för åska!!! Hjälp del 1"
- "Jag är så rädd för lightning nu. Som om jag bara sprang hem be"
- "På väg till Narcosses på världens Grand Floridian hotel och det finns en tropisk storm just nu. Jag är livrädd! ..."
- "Jag är i mitt badrum til regn stoppen. Jag är livrädd för blixtar och åska..."
- "Jag är livrädd för åska stormar * gömmer sig i hörnet *"
- "Jag är livrädd för åska: ()"
- "Om bara jag var vett min becky under denna åska orsak jag är jätterädd orsaken till en dålig erfarenhet"
Så... det fungerar! ... Tja, måste siffrorna tweaking för att ignorera världens "vredesutbrott", de kortlivade anfall av känslomässiga utbrott, och vara mer intresserade av större förändringar som innebära större nyheter.