Заняття 8. Операції типу GROUP BY засобами data.table та data.frame
Функції: :=, by=, aggregate, merge, by.
Завдання для самостійної роботи:
1. Для генерованого датасету:
N <- 10000
dt <- data.table(
n = 1:N,
name = replicate(N, paste0(sample(LETTERS, 5, replace = TRUE), collapse = "")),
p1 = rnorm(N, 0, 1),
p2 = rpois(N, 1))
Порівняти швидкість агрегацій: кількість рядків, що мають таке ж значення у полі p2 як і даний - за допомогою by-виразу із бібліотеки data.table, та функції aggregate.
2. Відновити вигляд результату, який отримується за допомогою by-виразу, для випадку використання функції aggregate (порядок рядків та стовпчиків).
3. Виконати обчислення із використанням функції by із бібліотеки base та порівняти із швидкістю обчислень із функцією aggregate.
Остання зміна: середа 8 квітня 2020 01:08 AM