R:패키지
편집하기
Sam
(
토론
|
기여
)
님의 2020년 8월 3일 (월) 23:10 판
(새 문서: {{R}}<br /> ==패키지 설치하기== {| class="wikitable" |+ ! ! |- |패키지 설치 |install.pakages("패키지명") |- |패키지 부착 |library("패키지명") |} <br /> ==...)
(차이) ← 이전 판 |
최신판
(
차이
) |
다음 판 →
(
차이
)
둘러보기로 이동
검색으로 이동
경고: 이 문서의 오래된 판을 편집하고 있습니다.
이것을 게시하면, 이 판 이후로 바뀐 모든 편집이 사라집니다.
경고:
로그인하지 않았습니다. 편집을 하면 IP 주소가 공개되게 됩니다.
로그인
하거나
계정을 생성하면
편집자가 사용자 이름으로 기록되고, 다른 장점도 있습니다.
스팸 방지 검사입니다. 이것을 입력하지
마세요
!
{{R}}<br /> ==패키지 설치하기== {| class="wikitable" |+ ! ! |- |패키지 설치 |install.pakages("패키지명") |- |패키지 부착 |library("패키지명") |} <br /> == ddply == 데이터를 집계하는 패키지. {| class="wikitable" !이름 !기원 !기능 !사용법 |- |ddply | |집계데이터를 만든다. 데이터셋을 고르고, 집계할 기준열을 고르고, 여기에 적용할 함수를 써서 계산열에 저장. (집계 기준에 해당하는 데이터끼리 연산되어 계산열에 저장된다.) ex) 집계기준열이 성적 A라면, 성적 A에 해당하는 이들의 평균만 계산하여 계산열에 저장한다. {| class="wikitable" |+ !성적 !평균 |- |A |A의 평균만 모아진다. |- |B |B의 평균만 모아진다. |- |... |... |} |새로운데이터셋 = ddply(데이터셋, c("집계기준열1, 집계기준열2, ...), summarise, 계산열 = 계산함수(데이터셋에서연산할컬럼명), 계산열2 = 계산함수(데이터셋에서연산할컬럼명2), ... ) |}<br /> == ggplot2 == R과 Python에서 그래프를 그려주는 패키지. {| class="wikitable" !단계 !방법 !사용법 |- |패키지 부착 |패키지 부착은 <code>library(ggplot2)</code> <code>library(ggthemes)</code> 2개를 시켜야 한다. |<code>library(ggplot2)</code> <code>library(ggthemes)</code> |- |기초 데이터 준비 |데이터셋과 x축에 둘 열을 준비 ggplot(데이터셋, aes( x = 열 )) aesthetic(미적)의 줄임말. |ggplot(데이터셋, aes( x = 열 )) |} == 그래프 그리기 == {| class="wikitable" !단계 !방법 !사용법 |- |각 축에 대한 막대를 그린다. (명목형 변수에 대하여) |ggplot(데이터셋, aes( x = 열이름1 )) + geom_bar(속성) 열에 해당하는 값을 세어 막대의 크기로 표현한다. {| class="wikitable" |+geom_bar 속성 !의도 !방법 !옵션 !효과 |- | rowspan="2" |색 채우기 | rowspan="2" |fill='색이름' |royalblue | |- |열이름1 |열마다 다른 색의 막대가 그려진다. |- |2가지 색 |aes(fill='열이름2') | |x축과 다른 열을 사용하면 1번 열에 해당하면서 2번째 열에 해당하는 갯수를 세어 막대를 2가지 색으로 나누어 표현한다. |} |기초데이터 + geom_bar(속성) |- |히스토그램 (연속형 변수에 대하여) |연속형변수를 일정구간으로 나누어 집계한다. ggplot(데이터셋, aes( x = 열이름1 )) + geom_histogram(속성) {| class="wikitable" |+histogram 속성 !의도 !방법 !옵션 !효과 |- |구간 정하기 |binwidth = 구간크기 | |구간크기로 자른다. |- |테두리색 |col='색이름' |red |테두리색을 지정한다. |- |색 채우기 |fill='색이름' | |막대 색을 채운다. |} |기초데이터 + geom_histogram(속성) |- |밀도그래프 (연속형 변수에 대하여) |위와 같은 개념이지만, 구간을 작게 나누어 부드러운 곡선을 그린다. ggplot(데이터셋, aes( x = 열이름1 )) + geom_density(속성) {| class="wikitable" |+density 속성 !의도 !방법 !옵션 !효과 |- |테두리색 |col='색이름' |red |테두리색을 지정한다. |- |색 채우기 |fill='색이름' | |막대 색을 채운다. |} |기초데이터 + geom_density(속성) |- |박스플롯 | |기초데이터 + geom_boxplot(속성) |- |산점도 |ggplot(데이터셋, aes( x = 열이름1, y = 열이름2 )) 다음처럼 특정 조건을 만족하는 값을 다른 색으로 처리해 계산할 수도 있다. geom_point(aes(col = 열이름) |기초데이터 + geom_point(속성) |} 그래프 안에 다른 열을 넣으면 그 열별로 따로 계산된다. geom_boxplot(aes(fill="열이름") == 이외 기능 == {| class="wikitable" !의도 !방법 !사용법 |- |라벨 붙이기 |위의 명령 뒤에 라벨을 붙인다. |그래프 + xlab("x라벨") + ylab("y라벨") |- |타이틀 붙이기 | |그래프 + ggtitle("타이틀") |- | | | |}
요약:
학교의 모든 지식. SMwiki에서의 모든 기여는 크리에이티브 커먼즈 저작자표시-비영리-동일조건변경허락 라이선스로 배포된다는 점을 유의해 주세요(자세한 내용에 대해서는
학교의 모든 지식. SMwiki:저작권
문서를 읽어주세요). 만약 여기에 동의하지 않는다면 문서를 저장하지 말아 주세요.
또한, 직접 작성했거나 퍼블릭 도메인과 같은 자유 문서에서 가져왔다는 것을 보증해야 합니다.
저작권이 있는 내용을 허가 없이 저장하지 마세요!
취소
편집 도움말
(새 창에서 열림)
이 문서에서 사용한 틀:
틀:R
(
편집
)
둘러보기 메뉴
개인 도구
로그인하지 않음
토론
기여
로그인
이름공간
문서
토론
한국어
보기
읽기
편집
원본 편집
역사 보기
더 보기
검색
둘러보기
대문
최근 바뀜
임의의 문서로
미디어위키 도움말
도구
여기를 가리키는 문서
가리키는 글의 최근 바뀜
특수 문서 목록
문서 정보