R:dplyr(데이터프레임 조작)
R언어 공부를 위한 틀 틀:R
개요
주요기여자 | |||
---|---|---|---|
전신 | plyr | 하들리 위컴, 로메인 프랑소와 | |
목적 |
dplyr
구성이 복잡한 경우, %>%
를 활용하여 연산을 펴서 입력하기 위한 도구이다.
데이터셋[범위] %>% #범위를 설정하고
rowMeans() %>% #연산할 함수를 설정한다.
head() #이어서 연산할 것들을 덧붙인다.
한 줄로 쓸 수 있지만, 그렇게 하면 읽기 복잡해진다. 이를 직관적으로 보기 위한 기능.
또한 %>% 로 다른 명령어와 연계할 수 있어, 굉장히 편하게 사용할 수 있다.
집계데이터 만들기
이름 | 기원 | 기능 | 사용법 |
---|---|---|---|
group_by() | 집계기준 조합을 정해준다.
집계된 그룹을 따라 연산해 열을 만들 수 있다. |
집계데이터 = 데이터셋 %>%
group_by(열이름1, 열이름2) %>% summarise(열이름3 = 연산, 열이름4 = 연산, ....) | |
ungroup() | 다시 사용할 땐 에러방지를 위해 ungroup 해주기. | 데이터형 = 기존데이터형 %>%
ungroup() | |
count() | 그룹화 이후에 사용하면 해당 그룹에 속한 데이터 갯수를 세어준다. | 집계데이터 = 데이터셋 %>%
group_by(열이름1, 열이름2) %>% count() |