R:개요
R언어 공부를 위한 틀 틀:R
개요
1995년 뉴질랜드 오클랜드대학의 로버트 젠틀먼, 로스 이하카에 의해 개발 시작.(그래서 R) R development core team에서 지속적인 개선중.
객체지향의 오픈소스 언어.
목적
배열, 행렬형태의 데이터를 다루기 위한 것.
장점
- 무료배포 소프트웨어
- SPSS, java, C, DBMS 등 다양한 프로그램언어와 서비스에 대한 확장성.
- 재현가능성. 이전의 분석을 다시 재현한다.
- 소통. stack overflow 등을 통해 교류하기 용이하다.
- 데이터 시각화에 특화.
많은 명령어가 있는데, 같은 기능을 하는 명령어들이 많다. -> 코드가 작성자에 따라 개성 넘친다. 가장 큰 장점이자 단점.
단점
데이터크기에 제약이 있다.(데이터를 ram에 저장하기 때문) => SQL 등을 통해 사전처리하거나 패키지로 개선 가능.
주요 사용처
- 기업. 구글, 페이스북, 트위터 등에서 통계, 분석에 사용한다.
할 수 있는 것
다양한 시각화. 각종 그래프, 스타차트, 산포도, 소셜네트워크분석, 지도시각화, 텍스트마이닝, 워드클라우드,
학습조언
파이썬과 달리, 복잡한 데이터를 다루기에, 책만으론 어려웠다. 영상의 도움을 받는 편이 좋다.
설치
편집기
기본적으로 대화식이지만, 파일>새로운 스크립트
안에서 코드를 짤 수 있다. 코드의 실행은 편집>전부실행
R만으로도 작성은 가능하나, 불편하다. 편의성을 위해 편집기가 필요하다.
Rstudio
기본은 Rstudio 편집기로 편집. 기본적인 편집편의기능은 타 언어나 리눅스와 동일.
우측에 변수나 파일을 볼 수 있어 관리에 용이하다.
스크립트를 작성하기 위해선 프로젝트 단위로 관리하는 게 편하다. File 안에서 만들 수 있다.
가로스크롤 비활성화
코드를 작성하다 길어지면 메모장마냥 우측으로 끝없이 길어지는데, tool>global option>code>soft-wrap resource files
를 선택하면 창 크기에 따라 자동 줄바꿈이 일어난다.
단축키
ctrl+enter는 실행.
Tinn-R
http://sourceforge.net/projects/tinn-r
문법에 따라 함수, 키워드 등으로 글꼴을 구분해주어 작성, 내용파악에 도움을 준다.