Hur man skapar attraktiva statistisk grafik på R/RStudio (3 / 10 steg)
Steg 3: Gruppera data på ett spridningsdiagram
Du kan gruppera data efter variabler med följande ggplot2 alternativ: färg, storlek, form och fyllning. I det här steget kommer vi titta på färg, storlek och form eftersom dessa fungerar bra för scatterplots. Alternativ för färg och storlek kan ställas in antingen en kontinuerlig numerisk variabel eller en kategorisk variabel.
1. grupp scatter handlingen i pris kontra karat av klarhet med hjälp av alternativet "färg".
qplot (carat, Pris, data = diamanter, färg = klarhet) < br >
Obs: Ggplot2 alternativet "färg" stavas avsiktligt i brittisk engelska form eftersom skaparen, Hadley Wickham, är från Nya Zeeland.
2. grupp scatter handlingen i pris kontra karat av x med hjälp av alternativet "storlek."
qplot (carat, Pris, data = diamanter, storlek = x) < br >
Obs: Som ni ser, är det möjligt att gruppen av numeriska variabler som kategoriska variabler eftersom ggplot2 automatiskt skalar dem.
3. grupp scatter handlingen i pris kontra karat av klipp med hjälp av alternativet "form."
qplot (carat, Pris, data = diamanter, form = skära) < br >