R:데이터베이스
R언어 공부를 위한 틀 틀:R
개요[편집 | 원본 편집]
많은 데이터를 저장하는 데엔 데이터베이스가 쓰인다.
ODBC(Open Database Connectivity)라는 DB표준규격이 있어 여러 종류의 데이터베이스에서 사용이 가능하다.
관련패키지[편집 | 원본 편집]
이름 | 용도 |
---|---|
RODBC | ODBC규격의 데이터베이스와 연결 |
RMySQL | 데이터베이스에 대한 R인터페이스 제공 |
MySQL | |
sqldf | R에서 SQL질의작업을 할 수 있게 |
RODBC[편집 | 원본 편집]
DSN(data source name) 설정[편집 | 원본 편집]
DSN을 ODBC 관리자에 등록해야 한다. 연결하여 데이터를 읽어올 수 있게끔.
윈도우 좌측 하단의 검색으로 ODBC 검색 > ODBC Data Sources (32-bit) > 위쪽 메뉴 중 system DSN > 추가 > 연결시키고자 하는 파일 추가
고급 탭에서 사용자아이디와 비밀번호를 등록할 수도 있다.
사용법[편집 | 원본 편집]
과정 | 방법 |
---|---|
R에 불러오기 | library(RODBC)
channelA = odbcConnect('DSN이름') #연결시키는 함수
channelB = odbcConnect('DSN이름2', uid="아이디", pwd="비밀번호") #등록된 이름을 따라 불러온다.
|
데이터가져오기 | df = sqlFetch(연결한체널명, '테이블명') |
연결종료 | odbcClose(연결한체널명)
모두 종료하려면 |
정보보기[편집 | 원본 편집]
과정 | 방법 |
---|---|
ODBC 데이서 소스 리스트 확인 | odbcDataSources()
odbcDataSources(type=c("all", "user",....)) |
ODBC연결에 대한 상세데이터 | odbcGetInfo(연결한체널명) |
테이블명 확인 | sqlTables(연결한체널명) |
질의열구조 보기 | sqlColumns(연결한체널명, '테이블명') |
테이블 정보 보기 | sqlFetch(연결한체널명, '테이블명') |
sqldf[편집 | 원본 편집]
R 데이터프레임에서 SQL질의를 하기 위한 패키지이다.