정밀도와 재현율 문서 원본 보기
←
정밀도와 재현율
둘러보기로 이동
검색으로 이동
문서 편집 권한이 없습니다. 다음 이유를 확인해주세요:
요청한 명령은 다음 권한을 가진 사용자에게 제한됩니다:
사용자
.
문서의 원본을 보거나 복사할 수 있습니다.
{{위키데이터 속성 추적}} [[파일:Precisionrecall.svg|thumb|350px|정밀도와 재현율]] 이진 분류 기법({{lang|en|binary classification}})을 사용하는 [[패턴 인식]]과 [[정보 검색]] 분야에서, '''정밀도'''는 검색된 결과들 중 관련 있는 것으로 분류된 결과물의 비율이고, '''재현율'''은 관련 있는 것으로 분류된 항목들 중 실제 검색된 항목들의 비율이다. 따라서 정밀도와 재현율 모두 관련도([[:en:relevance|Relevance]])의 측정 기준 및 지식을 토대로 하고 있다. == 정의 == [[정보 검색]] 분야에서, 정밀도와 재현율은 검색된 문서(retrieved documents; [[웹 검색 엔진]]에 의해 생성된 문서들) 및 관련 있는 문서(relevant documents; 웹 문서들 중 찾고자 하는 주제와 실제로 관련 있는 것들)에 의해 정의된다. === 정밀도 === 정보 검색 분야에서 정밀도(precision)는 검색된 문서들 중 관련 있는 문서들의 비율이다. :<math> \text{precision}=\frac{|\{\text{relevant documents}\}\cap\{\text{retrieved documents}\}|}{|\{\text{retrieved documents}\}|} </math> === 재현율 === 정보 검색 분야에서 재현율(recall)은 관련 있는 문서들 중 실제로 검색된 문서들의 비율이다. :<math> \text{recall}=\frac{|\{\text{relevant documents}\}\cap\{\text{retrieved documents}\}|}{|\{\text{relevant documents}\}|} </math> == 정의 == {| cellspacing="0" cellpadding="4" border="1" class="wikitable" | colspan="2" rowspan="2" | ! align="center" colspan="2" | 실제 정답 |- ! align="center" | Positive ! align="center" | Negative |- ! rowspan="2" | 실험 결과 ! align="center" | Positive | style="color:green;background-color:#ccffcc;" align="center" | '''True Positive''' | style="color:red;background-color:#ffcccc;" align="center" | '''False Positive'''</br>([[:en:Type I error|Type 1 Error]]) |- ! align="center" | Negative | style="color:red;background-color:#ffcccc;" align="center" | '''False Negative'''</br>([[:en:Type II error|Type 2 Error]]) | style="color:green;background-color:#ccffcc;" align="center" | '''True Negative''' |} 통계적 분류 분야에서 정밀도(precision)와 재현율(recall)은 다음과 같이 정의된다:<ref name="OlsonDelen">Olson, David L.; and Delen, Dursun (2008); ''Advanced Data Mining Techniques'', Springer, 1st edition (February 1, 2008), page 138, {{ISBN|3-540-76916-1}}</ref> : <math>\text{Precision}=\frac{tp}{tp+fp} \, </math> : <math>\text{Recall}=\frac{tp}{tp+fn} \, </math> 여기서 재현율은 [[:en:Sensitivity and specificity|sensitivity]]로도 불리며, 정밀도는 [[:en:Positive predictive value|positive predictive value]](PPV)로 불리기도 한다; 통계적 분류 분야에서 사용되는 다른 기준으로 True Negative Rate([[:en:Specificity_(tests)#Specificity|Specificity]])와 [[정확도]]([[:en:Accuracy_and_precision#In_binary_classification|Accuracy]]) 등이 있다.<ref name="OlsonDelen" /> : <math>\text{True negative rate}=\frac{tn}{tn+fp} \, </math> : <math>\text{Accuracy}=\frac{tp+tn}{tp+tn+fp+fn} \, </math> == 같이 보기 == * [[민감도와 특이도]] * [[혼동 행렬]] * [[기저율 오류]] == 출처 == <references/> * Baeza-Yates, Ricardo; Ribeiro-Neto, Berthier (1999). ''Modern Information Retrieval''. New York, NY: ACM Press, Addison-Wesley, Seiten 75 ff. {{ISBN|0-201-39829-X}} * Hjørland, Birger (2010); ''The foundation of the concept of relevance'', Journal of the American Society for Information Science and Technology, 61(2), 217-237 * Makhoul, John; Kubala, Francis; Schwartz, Richard; and Weischedel, Ralph (1999); [http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.27.4637 ''Performance measures for information extraction''], in ''Proceedings of DARPA Broadcast News Workshop, Herndon, VA, February 1999'' * van Rijsbergen, Cornelis Joost "Keith" (1979); ''Information Retrieval'', London, GB; Boston, MA: Butterworth, 2nd Edition, {{ISBN|0-408-70929-4}} [[분류:정보 검색]] [[분류:생물정보학]]
이 문서에서 사용한 틀:
틀:ISBN
(
원본 보기
)
틀:Lang
(
원본 보기
)
틀:위키데이터 속성 추적
(
원본 보기
)
정밀도와 재현율
문서로 돌아갑니다.
둘러보기 메뉴
개인 도구
로그인
이름공간
문서
토론
한국어
보기
읽기
원본 보기
역사 보기
더 보기
검색
둘러보기
대문
최근 바뀜
임의의 문서로
미디어위키 도움말
특수 문서 목록
도구
여기를 가리키는 문서
가리키는 글의 최근 바뀜
문서 정보