R:dplyr(데이터프레임 조작)
편집하기 (부분)
둘러보기로 이동
검색으로 이동
경고:
로그인하지 않았습니다. 편집을 하면 IP 주소가 공개되게 됩니다.
로그인
하거나
계정을 생성하면
편집자가 사용자 이름으로 기록되고, 다른 장점도 있습니다.
스팸 방지 검사입니다. 이것을 입력하지
마세요
!
===집계데이터 만들기=== {| class="wikitable" !이름 !기원 !기능 !사용법 |- |group_by() | |집계기준 조합을 정해준다. 집계된 그룹을 따라 연산해 열을 만들 수 있다. 일반적으로 summarise와 같이 사용. |데이터셋 %>% group_by(열이름1, 열이름2, ...) #table()과 같은 방식으로 그룹화한다. |- |ungroup() | |다시 사용할 땐 에러방지를 위해 ungroup 해주기. |데이터형 = 기존데이터형 %>% ungroup() |- |summarise() | |요약통계량 산출. 그룹의 통계량을 구할 수 있다. 그룹별로 mean, max 등 값을 얻을 수 있음. (n함수는 그룹에 해당하는 갯수를 세어주는 함수) |데이터셋 %>% group_by(열이름1, 열이름2) %>% summarise(열이름3 = 연산, 열이름4 = 연산, ....) 데이터셋 %>% group_by(class, pass) %>% summarise(n_pass =n()) #반별로 pass 여부를 세어준다. |- |count() | |그룹화 이후에 사용하면 해당 그룹에 속한 데이터 갯수를 세어준다. |집계데이터 = 데이터셋 %>% group_by(열이름1, 열이름2) %>% count() |} {| class="wikitable" !이름 !기원 !기능 !사용법 |- | | | | |- | | | | |- | | | | |- | | | | |- |distinct() | |중복데이터 제거. 해당 열이름에서 하나라도 중복되면 지운다. |데이터셋 = 데이터셋 %>% distinct(열이름1, 열이름2, 열이름3, ...) |}
요약:
학교의 모든 지식. SMwiki에서의 모든 기여는 크리에이티브 커먼즈 저작자표시-비영리-동일조건변경허락 라이선스로 배포된다는 점을 유의해 주세요(자세한 내용에 대해서는
학교의 모든 지식. SMwiki:저작권
문서를 읽어주세요). 만약 여기에 동의하지 않는다면 문서를 저장하지 말아 주세요.
또한, 직접 작성했거나 퍼블릭 도메인과 같은 자유 문서에서 가져왔다는 것을 보증해야 합니다.
저작권이 있는 내용을 허가 없이 저장하지 마세요!
취소
편집 도움말
(새 창에서 열림)
둘러보기 메뉴
개인 도구
로그인하지 않음
토론
기여
로그인
이름공간
문서
토론
한국어
보기
읽기
편집
원본 편집
역사 보기
더 보기
검색
둘러보기
대문
최근 바뀜
임의의 문서로
미디어위키 도움말
도구
여기를 가리키는 문서
가리키는 글의 최근 바뀜
특수 문서 목록
문서 정보