Tutoriál R/Faktory

Z WikiSkript

Faktory jsou vektory textových hodnot, kde každá hodnota patří do své kategorie (levelu), např.

x <- factor( 
    c("muž", "žena", "muž", "muž")
) # pořadí kategorií je defaultně abecední

x <- factor( 
    c("muž", "žena", "muž", "muž"),
    levels = c("žena", "muž") 
) # zde si pořadí kategorií určíme sami


Změna názvů kategorií

dotaznik_vektor <- c("M", "F", "F", "M", "M")
dotaznik <- factor(dotaznik_vektor)

# Kategorie faktoru ''dotaznik'' jsou seřazeny abecedně
# Přejmenujeme je takto
levels(dotaznik) <- c("Female", "Male")
dotaznik

# Přehledné zobrazení obsahu proměnné
summary(dotaznik)


Porovnávání seřazených faktorů

# Faktor rychlostí
rychlost_vektor <- c("fast", "slow", "slow", "fast", "insane")
rychlost <- factor(rychlost_vektor, ordered = TRUE,
            levels = c("slow", "fast", "insane")
)

item2 <- rychlost[2] # slow
item5 <- rychlost[5] # insane

# Má druhá položka ve faktoru vyšší pořadí než položka pátá?
item2 > item5

# Kdybychom totéž zkusili bez "ordered=TRUE", operace by nedávala smysl a skončila by chybou