R:자주사용하는 함수

학교의 모든 지식. SMwiki
Sam (토론 | 기여)님의 2020년 8월 27일 (목) 10:07 판 (→‎수학함수)
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)
둘러보기로 이동 검색으로 이동

R언어 공부를 위한 틀 틀:R

  1. R:개요
    1. R:코딩팁
    2. R:연산자
  2. R:객체
    1. R:자료형
    2. R:자료구조
  3. R:함수
    1. R:자주사용하는 함수
      1. R:aplly계열(반복문, 중복작업)
  4. R:제어문
    1. R:조건문
    2. R:반복문
  5. R:자료조작
    1. R:데이터프레임
    2. R:행렬
  6. R:데이터 저장과 불러오기
    1. R:데이터베이스
    2. R:특정조건 추출하기
  7. R:패키지
    1. R:magrittr(파이프연산자)
    2. R:dplyr(데이터프레임 조작)
    3. R:ggplot2(그래프그리기)
    4. R:KoNLP(한글 텍스트마이닝), wordcloud2(워드클라우드)
    5. R:ddply(데이터 집계, 조작)
    6. R:tidyverse(데이터를 정제하는 패키지들의 집합)
    7. R:jsonlite(JSON 파일 다루기)
    8. R:pbapply(apply계열에 진행바를 보여준다.)
  8. R:활용
    1. R:데이터 접근
    2. R:연관성분석
    3. R:분류분석
  9. R:팁
    1. R:연구용 팁

수학함수

수치조작

이름 기원 기능 사용법
abs() 절대값을 구한다. abs(x)
ceiling() 올림 ceiling(x)
floor() 내림 floor(x)
round() 반올림 round(대상숫자, digits=반올림할소수점아랫수)

형태변화

이름 기원 기능 사용법
exp() exponential 지수함수 exp(x)
log() log 로그함수. log숫자(x) 형태로 사용한다.

밑수를 안넣으면 기본적으로 e

log10(x)
sin() sin, atan 등 다양한 수학함수들이 있다.

연산

의도 설명 사용법
sum(x)
sqrt() 제곱근을 구한다. sqrt(x)

통계

의도 설명 사용법
평균 구하기 mean(x)

ave(x)

중위수 median(x)
표준편차구하기 sd(x)
분산 var(x)
중간값 구하기 median(x)
최대, 최소범위 구하기 range(x)
사분위수 quantile(x)
표준화 scale(x)
이름 기원 기능 사용법
factorial() 계승 출력. factorial(x)

ex) factorial(3) 은 6이다.

choose() choose(선발수, 전체수)

전체수에서 선발수를 뽑는 경우의 수를 구한다.

choose(x, y)

데이터 통계

이름 기원 기능 사용법
table() table 빈도 테이블 작성.

열 안에 속한 요소가 몇 번씩 등장하는지 세어 테이블로 만든다.

열 안에 속한 속성 1이 몇개, 2가 몇개 인지 보여준다.

table(데이터셋$열이름)

테이블명 = as.data.frame(table(데이터셋$열이름)) #뽑아서 데이터베이스로 만들 수도 있다.

ftable() 삼원분할표 작성.
옵션 설명 예시
exclude= 제외할 범주값을 표시한다. c(NA, NaN)
row.vars= 분할표를 재구성할 때 사용될 행 변수. NULL
col.vars= 분할표를 재구성할 때 사용될 열 변수. NULL
xtabs() 2차원 테이블 작성.

열이름1과 열이름2 안에 나타나는 조합의 수별로 몇 번씩 등장하는지 센다.

테이블명 = as.data.frame(xtabs(~ 데이터셋$열이름1 + 데이터셋$열이름2))
aggregate() 열이름1에 속한 데이터들의 연산결과를 정리해 요약한다. aggregate(데이터셋[1:3], 데이터셋[기준열번호], 연산)

aggregate(데이터셋[2:3], 데이터셋[1], mean) #1열을 기준으로 2,3열 데이터의 평균을 구한다.