일반화 벡터 공간 모델 문서 원본 보기
←
일반화 벡터 공간 모델
둘러보기로 이동
검색으로 이동
문서 편집 권한이 없습니다. 다음 이유를 확인해주세요:
요청한 명령은 다음 권한을 가진 사용자에게 제한됩니다:
사용자
.
문서의 원본을 보거나 복사할 수 있습니다.
{{위키데이터 속성 추적}} '''일반화 벡터 공간 모델'''(一般化―空間―, {{llang|en|generalized vector space model}})은 [[정보 검색]]에서 사용되는 [[벡터 공간 모델]]을 일반화한 모델이다. 웡 등은 그의 연구<ref name="wong">{{인용 |제목=Generalized vector spaces model in information retrieval | url=http://doi.acm.org/10.1145/253495.253506 |저자=S. K. M. Wong |공저자=Wojciech Ziarko, Patrick C. N. Wong |출판사=[[ACM|SIGIR ACM]] |날짜=1985-06-05}}</ref>에서 [[벡터 공간 모델]]의 상호 직교성 가정이 갖는 문제점을 분석하였으며, 기존의 모델을 보완하는 일반화 벡터 공간 모델을 제안하였다. ==정의== 일반화 벡터 공간 모델은 상호 직교성 가정을 버리고 단어간 상관도 개념을 도입하였다. 이에 각 단어 벡터 ''t<sub>i</sub>''가 ''2<sup>n</sup>''개의 벡터 ''m<sub>r</sub>''의 선형 조합으로 표현되는 새로운 공간 개념이 사용된다. 여기서 ''r = 1...2<sup>n</sup>''이다. 문서 ''d<sub>k</sub>''와 질의 ''q''의 유사도는 다음과 같이 계산된다. :<math>sim(d_k,q) = \frac{\sum _{j=1}^n \sum _{i=1}^n w_{i,k}*w_{j,q}*t_i \cdot t_j }{\sqrt{\sum _{i=1}^n w_{i,k}^2}*\sqrt{\sum _{i=1}^n w_{i,q}^2}}</math> ''t<sub>i</sub>''와 ''t<sub>j</sub>''는 ''2<sup>n</sup>''차원 공간의 벡터이다. 단어 상관도 <math>t_i \cdot t_j</math>는 여러 가지 방식으로 구현될 수 있다. 웡의 논문에서는 자동 색인에 의해 생성된 단어 빈도 행렬을 입력으로 받아 모든 색인 단어쌍에 대한 상관도를 출력하는 알고리즘을 적용하였다. ==의미 정보의 처리== 전체 단어 일치 방식을 제외했을 때, 정보 검색 모델에서 단어간 관련성을 고려하는 방향에는 크게 다음의 두 가지가 있다. # 단어간의 의미적 상관도를 계산하는 방식 # 대량의 말뭉치에서 단어들의 동시 발생 빈도를 통계적으로 계산하는 방식 최근 차차로니스에 의한 발표된 논문<ref>{{인용 |제목=A Generalized Vector Space Model for Text Retrieval Based on Semantic Relatedness | url=http://www.aclweb.org/anthology/E/E09/E09-3009.pdf |저자= George Tsatsaronis |공저자=Vicky Panagiotopoulou |출판사=[[ACM|EACL ACM]] |날짜=2009-04-02}}</ref>에서 첫 번째 방식에 대해 자세히 다루었다. 이 논문에서는 의미적 관련성(semantic relatedness, ''SR'')을 [[워드넷]]과 같은 유의어 사전(''O'')을 이용해 계산했다. 밀도(compactness, ''SCM'')에 의해 구해지는 경로 길이(path length)와 의미적 길이 합성(sementic path elaboration, ''SPE'')에 의해 구해지는 경로 깊이(path depth) 개념이 사용되었다. 유사도 공식에 포함된 <math>t_i \cdot t_j</math> 값은 다음과 같이 계산되었다. <math>t_i \cdot t_j = SR((t_i, t_j), (s_i, s_j), O)</math> ''s<sub>i</sub>''와 ''s<sub>j</sub>''는 각각 단어 ''t<sub>i</sub>''와 ''t<sub>j</sub>''의 의미이며, <math>SCM \cdot SPE</math>를 최대화하는 값으로 결정된다. == 각주 == {{각주}} [[분류:벡터 공간 모델]]
이 문서에서 사용한 틀:
틀:Llang
(
원본 보기
)
틀:각주
(
원본 보기
)
틀:위키데이터 속성 추적
(
원본 보기
)
틀:인용
(
원본 보기
)
일반화 벡터 공간 모델
문서로 돌아갑니다.
둘러보기 메뉴
개인 도구
로그인
이름공간
문서
토론
한국어
보기
읽기
원본 보기
역사 보기
더 보기
검색
둘러보기
대문
최근 바뀜
임의의 문서로
미디어위키 도움말
특수 문서 목록
도구
여기를 가리키는 문서
가리키는 글의 최근 바뀜
문서 정보