Функції: :=, by=, aggregate, merge, by.

Завдання для самостійної роботи:

1.      Для генерованого датасету:
N <- 10000 
dt <- data.table( 
n = 1:N, 
name = replicate(N, paste0(sample(LETTERS, 5, replace = TRUE), collapse = "")), 
p1 = rnorm(N, 0, 1), 
p2 = rpois(N, 1))
Порівняти швидкість агрегацій: кількість рядків, що мають таке ж значення у полі p2 як і даний - за допомогою by-виразу із бібліотеки data.table, та функції aggregate.

2.      Відновити вигляд результату, який отримується за допомогою by-виразу, для випадку використання функції aggregate (порядок рядків та стовпчиків).

3.      Виконати обчислення із використанням функції by із бібліотеки base та порівняти із швидкістю обчислень із функцією aggregate.



Last modified: Wednesday, 8 April 2020, 1:08 AM