Domací cvičení - Manipulace s proměnnými 2
Úkol 1
Vyberte z datasetu countries všechny proměnné, které jsou typu “character” a obsahují podtržítko.
Řešení
%>% select(where(is.character) & contains("_")) countries
Úkol 2
Všechny numerické proměnné zaokrouhlete na 2 desetinná místa.
Řešení
%>% mutate(across(where(is.numeric), round, 2)) countries
Úkol 3
Pro všechny numerické proměnné najděte směrodatnou odchylku.
Řešení
%>% summarise(across(where(is.numeric), sd, na.rm = TRUE)) countries
Úkol 4
Pro proměnné gdp
, population
a area
najděte průměr.
Řešení
%>% summarise(across(c("gdp", "population", "area"),
countries na.rm = TRUE)) mean,
Úkol 5
Vytvořte v datasetu tři nové proměnné uni_prc_di_cat_mean
, poverty_risk_di_cat_mean
a material_dep_di_cat_mean
, které budou mít hodnotu průměru dané původní proměnné pro podskupinu zemí podle di_cat
. Například na řádku Dánska, Němekca atp. bude průměrná hodnota ze zemí, které jsou Full democracy na řádcích Bulharska, Belgie a Česka bude průměrná hodnota ze zemí Flawed democracy atp.
Řešení
%>% group_by(di_cat) %>%
countries mutate(across(.cols = c("uni_prc", "poverty_risk", "material_dep"),
.fns = mean,
na.rm = TRUE,
.names = "{col}_di_cat_mean"))
Úkol 6
Vyberte všechny proměnné z datasetu countries
, které začínají písmenem “p” (bez pojmenování jednotlivých proměnných začínajících na “p”). Pro správný tvar pomocné funkce můžete použít online nápovědu.
Řešení
%>% select(starts_with("p")) countries