<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ko">
	<id>https://smwiki.info/index.php?action=history&amp;feed=atom&amp;title=R%3A%EB%B6%84%EB%A5%98%EB%B6%84%EC%84%9D</id>
	<title>R:분류분석 - 편집 역사</title>
	<link rel="self" type="application/atom+xml" href="https://smwiki.info/index.php?action=history&amp;feed=atom&amp;title=R%3A%EB%B6%84%EB%A5%98%EB%B6%84%EC%84%9D"/>
	<link rel="alternate" type="text/html" href="https://smwiki.info/index.php?title=R:%EB%B6%84%EB%A5%98%EB%B6%84%EC%84%9D&amp;action=history"/>
	<updated>2026-04-26T13:03:12Z</updated>
	<subtitle>이 문서의 편집 역사</subtitle>
	<generator>MediaWiki 1.45.1</generator>
	<entry>
		<id>https://smwiki.info/index.php?title=R:%EB%B6%84%EB%A5%98%EB%B6%84%EC%84%9D&amp;diff=486&amp;oldid=prev</id>
		<title>Sam: 새 문서: {{R}}  == 개요 == 수집된 데이터를 갖고 자동으로 분류할 수 없을까? 머신러닝의 원리.  학습을 통해 분류분석 모델을 만들어 분류기준으로...</title>
		<link rel="alternate" type="text/html" href="https://smwiki.info/index.php?title=R:%EB%B6%84%EB%A5%98%EB%B6%84%EC%84%9D&amp;diff=486&amp;oldid=prev"/>
		<updated>2020-08-24T11:58:44Z</updated>

		<summary type="html">&lt;p&gt;새 문서: {{R}}  == 개요 == 수집된 데이터를 갖고 자동으로 분류할 수 없을까? 머신러닝의 원리.  학습을 통해 분류분석 모델을 만들어 분류기준으로...&lt;/p&gt;
&lt;p&gt;&lt;b&gt;새 문서&lt;/b&gt;&lt;/p&gt;&lt;div&gt;{{R}}&lt;br /&gt;
&lt;br /&gt;
== 개요 ==&lt;br /&gt;
수집된 데이터를 갖고 자동으로 분류할 수 없을까? 머신러닝의 원리.&lt;br /&gt;
&lt;br /&gt;
학습을 통해 분류분석 모델을 만들어 분류기준으로 활용한다.&lt;br /&gt;
&amp;lt;br /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== 의사분석 트리 ==&lt;br /&gt;
&amp;lt;br /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== 모델 정확도 ===&lt;br /&gt;
Kappa계수 = (정확도 - 우연히일치할가능성) / (1-우연히일치할가능성)&lt;br /&gt;
&lt;br /&gt;
0.8~1 라면 완벽.&lt;br /&gt;
&lt;br /&gt;
0.5 즈음부터 적당하다 보면 된다.&lt;br /&gt;
&amp;lt;br /&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== 모델 나누기 ===&lt;br /&gt;
훈련데이터와 검증데이터로 구분해야 한다. 데이터셋1$model 안에 분류값이 들어가 있다.&lt;br /&gt;
&lt;br /&gt;
벡터 &amp;lt;- createDataPartition(데이터셋1$model, p=0.8, list=F) #훈련데이터로 사용할 인덱스를 얻을 수 있다. 이건 패키지 caret을 이용하는듯?&lt;br /&gt;
&lt;br /&gt;
훈련데이터 &amp;lt;- 데이터셋[벡터, ]&lt;br /&gt;
&lt;br /&gt;
검증데이터 &amp;lt;- 데이터셋[-벡터, ]&lt;br /&gt;
&lt;br /&gt;
&amp;lt;nowiki&amp;gt;#&amp;lt;/nowiki&amp;gt;패키지 rpart를 설치, 불러온다.&lt;br /&gt;
&lt;br /&gt;
분류모델 &amp;lt;- rpart(model~., data=훈련데이터, contro=rpart.control(minsplit=노드에포함되는데이터겟수)         #.은 모든 요인이라는 의미. 대략 2??&lt;br /&gt;
&lt;br /&gt;
=== 데이터 해석(시각화) ===&lt;br /&gt;
rpart.plot 패키지 설치, 이용한다.&lt;br /&gt;
&lt;br /&gt;
rpart.plot(분류모델) #분류알고리즘을 시각화하여 보여준다. 1행은 예상분류. 2행의 숫자는 각 사과별로 확률, 3행의 퍼센트는 해당 거름망에 도달한 데이터 비율을 나타낸다. 왼쪽이 yes, 우측이 no를 의미하는 길이다.&lt;br /&gt;
&lt;br /&gt;
=== 테스트 ===&lt;br /&gt;
예측객체 = predick(분류모델, 검증데이터, type=&amp;quot;class&amp;quot;)&lt;br /&gt;
&lt;br /&gt;
actual &amp;lt;- 검증데이터$모델&lt;br /&gt;
&lt;br /&gt;
confusionMatrix(actual, 예측객체, mode=&amp;quot;everything&amp;quot;) #행렬로 정확도를 예측한다.&lt;br /&gt;
&amp;lt;br /&amp;gt;&lt;/div&gt;</summary>
		<author><name>Sam</name></author>
	</entry>
</feed>