Domací cvičení - Manipulace s proměnnými 2
Úkol 1
Vyberte z datasetu countries všechny proměnné, které jsou typu “character” a obsahují podtržítko.
Řešení
countries %>% select(where(is.character) & contains("_"))Úkol 2
Všechny numerické proměnné zaokrouhlete na 2 desetinná místa.
Řešení
countries %>% mutate(across(where(is.numeric), round, 2))Úkol 3
Pro všechny numerické proměnné najděte směrodatnou odchylku.
Řešení
countries %>% summarise(across(where(is.numeric), sd, na.rm = TRUE))Úkol 4
Pro proměnné gdp, population a area najděte průměr.
Řešení
countries %>% summarise(across(c("gdp", "population", "area"),
mean, na.rm = TRUE))Úkol 5
Vytvořte v datasetu tři nové proměnné uni_prc_di_cat_mean, poverty_risk_di_cat_mean a material_dep_di_cat_mean, které budou mít hodnotu průměru dané původní proměnné pro podskupinu zemí podle di_cat. Například na řádku Dánska, Němekca atp. bude průměrná hodnota ze zemí, které jsou Full democracy na řádcích Bulharska, Belgie a Česka bude průměrná hodnota ze zemí Flawed democracy atp.
Řešení
countries %>% group_by(di_cat) %>%
mutate(across(.cols = c("uni_prc", "poverty_risk", "material_dep"),
.fns = mean,
na.rm = TRUE,
.names = "{col}_di_cat_mean"))Úkol 6
Vyberte všechny proměnné z datasetu countries, které začínají písmenem “p” (bez pojmenování jednotlivých proměnných začínajících na “p”). Pro správný tvar pomocné funkce můžete použít online nápovědu.
Řešení
countries %>% select(starts_with("p"))