R:자료형: 두 판 사이의 차이

학교의 모든 지식. SMwiki
둘러보기로 이동 검색으로 이동
잔글 (Sam님이 R:변수형 문서를 R:변수 문서로 이동했습니다)
편집 요약 없음
1번째 줄: 1번째 줄:
{{R}}<br />
{{R}}<br />


== 변수형 ==
==변수형==
{| class="wikitable"
{| class="wikitable"
|+
|+
52번째 줄: 52번째 줄:
|}
|}


== 관련함수 ==
==관련함수==
{| class="wikitable"
{| class="wikitable"
!이름
!이름
62번째 줄: 62번째 줄:
|
|
|데이터의 타입 확인
|데이터의 타입 확인
|str(데이터)
|-
|is()
|is
|데이터의 타입 확인
str이 변수타입을 알려준다면,
is는 참과 거짓으로 알려준다.
|is.integer(데이터)
|-
|as()
|as
|변수타입을 바꾼다.
|as.integer(데이터)
|-
|summary()
|summary
|해당 데이터의 요약정보를 본다.
변수타입과 관련 정보들을 보여준다.
|summary(데이터)
|-
|
|
|
|
|}<br />
== 시간변수 다루기 ==
3가지 방법이 있다.
{| class="wikitable"
|+
!방법
!사용처
!사용예시
|-
|as.Date()
|년-월-일 형태
|as.Date(변수, formet="날짜형식")
as.Date(2020-08-03, formet="%Y-%m-%d"
|-
|as.POSIXct()
|년-월-일 시:분:초 형태
|
|-
|lubridate패키지
|
|
|
|}
|}
=== 날짜형식 ===
2020년 1월 22일 23시 24분 25초 월요일 이라고 할 때의 데이터 표시를 알아보자.
{| class="wikitable"
|+
!
!형식
!예시
!형식
!예시
|-
!세기
|%C
|20세기
|
|
|-
!년
|%Y
|2020
|%y
|20
|-
! rowspan="2" |월
|%m
|01
|%B
|1월
|-
|%b
|1
|
|
|-
!일
|%d
|22
|
|
|-
! rowspan="2" |시
|%H
|23
|%l
|11
|-
|%p
|PM
|
|
|-
!분
|%M
|24
|
|
|-
!초
|%S
|25
|
|
|-
! rowspan="2" |요일
|%a
|월
|%A
|월요일
|-
|%u
|1~7
(1:월요일)
|%w
|0~6
(2:월요일)
|}
<br />
=== 시간변수 관련함수 ===
{| class="wikitable"
!이름
!기원
!기능
!사용법
|-
|format()
|
|형식에 해당하는 데이터만 뽑는다.
|format(날짜변수, "형식")
|}<br />

2020년 8월 3일 (월) 17:46 판

R언어 공부를 위한 틀 틀:R

  1. R:개요
    1. R:코딩팁
    2. R:연산자
  2. R:객체
    1. R:자료형
    2. R:자료구조
  3. R:함수
    1. R:자주사용하는 함수
      1. R:aplly계열(반복문, 중복작업)
  4. R:제어문
    1. R:조건문
    2. R:반복문
  5. R:자료조작
    1. R:데이터프레임
    2. R:행렬
  6. R:데이터 저장과 불러오기
    1. R:데이터베이스
    2. R:특정조건 추출하기
  7. R:패키지
    1. R:magrittr(파이프연산자)
    2. R:dplyr(데이터프레임 조작)
    3. R:ggplot2(그래프그리기)
    4. R:KoNLP(한글 텍스트마이닝), wordcloud2(워드클라우드)
    5. R:ddply(데이터 집계, 조작)
    6. R:tidyverse(데이터를 정제하는 패키지들의 집합)
    7. R:jsonlite(JSON 파일 다루기)
    8. R:pbapply(apply계열에 진행바를 보여준다.)
  8. R:활용
    1. R:데이터 접근
    2. R:연관성분석
    3. R:분류분석
  9. R:팁
    1. R:연구용 팁

변수형

변수타입 기원 설명
chr character 문자열
int integer 정수
num numeric 자연수
Factor 명목형 변수
Posixct 시간변수(년월일시분초)
Tseries 시계열 변수
변수명 설명 정보량 변환
명목형변수 특성에 따라 명칭을 주어 구분하는 변수 아래로 갈수록 정보량이 많아진다. 아래에서 위로 변환은 가능하지만,

위에서 아래로의 변환은 정보량 부족으로 불가.

서열형변수 명목형변수에서 서열정보 추가
연속형변수 셀 수 없으며, 구간(0~10)으로 정의되는 변수

관련함수

이름 기원 기능 사용법
str() 데이터의 타입 확인 str(데이터)
is() is 데이터의 타입 확인

str이 변수타입을 알려준다면,

is는 참과 거짓으로 알려준다.

is.integer(데이터)
as() as 변수타입을 바꾼다. as.integer(데이터)
summary() summary 해당 데이터의 요약정보를 본다.

변수타입과 관련 정보들을 보여준다.

summary(데이터)


시간변수 다루기

3가지 방법이 있다.

방법 사용처 사용예시
as.Date() 년-월-일 형태 as.Date(변수, formet="날짜형식")

as.Date(2020-08-03, formet="%Y-%m-%d"

as.POSIXct() 년-월-일 시:분:초 형태
lubridate패키지

날짜형식

2020년 1월 22일 23시 24분 25초 월요일 이라고 할 때의 데이터 표시를 알아보자.

형식 예시 형식 예시
세기 %C 20세기
%Y 2020 %y 20
%m 01 %B 1월
%b 1
%d 22
%H 23 %l 11
%p PM
%M 24
%S 25
요일 %a %A 월요일
%u 1~7

(1:월요일)

%w 0~6

(2:월요일)


시간변수 관련함수

이름 기원 기능 사용법
format() 형식에 해당하는 데이터만 뽑는다. format(날짜변수, "형식")