R:패키지

학교의 모든 지식. SMwiki
Sam (토론 | 기여)님의 2020년 8월 12일 (수) 15:37 판 (→‎dplyr)
둘러보기로 이동 검색으로 이동

R언어 공부를 위한 틀 틀:R

  1. R:개요
    1. R:코딩팁
    2. R:연산자
  2. R:객체
    1. R:자료형
    2. R:자료구조
  3. R:함수
    1. R:자주사용하는 함수
      1. R:aplly계열(반복문, 중복작업)
  4. R:제어문
    1. R:조건문
    2. R:반복문
  5. R:자료조작
    1. R:데이터프레임
    2. R:행렬
  6. R:데이터 저장과 불러오기
    1. R:데이터베이스
    2. R:특정조건 추출하기
  7. R:패키지
    1. R:magrittr(파이프연산자)
    2. R:dplyr(데이터프레임 조작)
    3. R:ggplot2(그래프그리기)
    4. R:KoNLP(한글 텍스트마이닝), wordcloud2(워드클라우드)
    5. R:ddply(데이터 집계, 조작)
    6. R:tidyverse(데이터를 정제하는 패키지들의 집합)
    7. R:jsonlite(JSON 파일 다루기)
    8. R:pbapply(apply계열에 진행바를 보여준다.)
  8. R:활용
    1. R:데이터 접근
    2. R:연관성분석
    3. R:분류분석
  9. R:팁
    1. R:연구용 팁

개요

다양한 기능들을 구현해둔 패키지가 많다.

패키지 관련함수

패키지 관리

의도 방법
패키지 설치 install.pakages("패키지명")
패키지 부착 library("패키지명")
갱신할 수 있는 패키지 파악 old.packages()
패키지 갱신 update.pakages()

패키지 사용

의도 방법
현재 사용되는 패키지 파악 search()
패키지 구동 취소 detach("search에서 나온 패키지명")


ddply

데이터를 집계하는 패키지.

이름 기원 기능 사용법
ddply 집계데이터를 만든다.

데이터셋을 고르고, 집계할 기준열을 고르고,

여기에 적용할 함수를 써서 계산열에 저장.

(집계 기준에 해당하는 데이터끼리 연산되어 계산열에 저장된다.)

ex) 집계기준열이 성적 A라면, 성적 A에 해당하는 이들의 평균만 계산하여 계산열에 저장한다.

성적 평균
A A의 평균만 모아진다.
B B의 평균만 모아진다.
... ...
새로운데이터셋 = ddply(데이터셋,

c("집계기준열1, 집계기준열2, ...), summarise,

계산열 = 계산함수(데이터셋에서연산할컬럼명),

계산열2 = 계산함수(데이터셋에서연산할컬럼명2),

...

)


apply

library(dplyr)

library(reshape)

library(plyr)

apply

for문이 여러 개의 열에 대해 작동하게 하려면 코드가 복잡해진다. apply는 동시에 여러 행과 열을 연산하는 데 편하다.

이름 기원 기능 사용법
apply() apply(데이터셋[범위], 계산기준, 연산)