연어 (언어학) 문서 원본 보기
←
연어 (언어학)
둘러보기로 이동
검색으로 이동
문서 편집 권한이 없습니다. 다음 이유를 확인해주세요:
요청한 명령은 다음 권한을 가진 사용자에게 제한됩니다:
사용자
.
문서의 원본을 보거나 복사할 수 있습니다.
{{위키데이터 속성 추적}} '''연어'''(連語, collocation)는 동일한 맥락에서 일반적인 경우보다 높은 빈도로 나타나는 어휘의 쌍이다. 가령 [[한국어]] 화자는 ‘감을 붙잡다’보다는 ‘감을 잡다’를 자연스럽게 여기며, [[영어]] 화자는 ‘strong computer’보다는 ‘powerful computer’를 선호한다. 공기(共起)하는 모든 어휘가 연어가 되는 것은 아니며, 두 어휘의 공기 빈도가 통계적인 기대 빈도보다 높은 경우에 연어가 된다. 그러나 ‘미역국을 먹다’처럼 문자 그대로의 의미로 쓰이지 않고 수사적 의미를 강하게 갖는 경우에는 연어라고 하지 않고 [[관용구]]라고 한다. 즉 연어는 일반적인 공기어와 관용구의 사이에 있다. 연어는 언어적, 문화적, 심리적 맥락에서 함께 쓰이는 것이 선호되므로, [[사전 편찬]]이나 [[외국어]] 교육에서 중요하게 다루어져야 한다. 가령 모국어 화자는 직관적으로 알 수 있지만 해당 언어를 배우는 학습자는 잘 알지 못하는 연어가 높은 빈도로 사용된다면, [[말뭉치]]에서 그 빈도를 파악하여 빈도에 따라 자세히 다룰 필요가 존재한다. == 연어 추출 공식 == 통계학적으로 유의미한 연어를 추출하기 위해서는 [[T-test]], [[상호의존정보]](MI score), [[가능도|로그 가능도]] 등이 주로 사용된다. 그 중 어휘 A와 어휘 B가 연이어 있을 때 이것이 연어인지 판정하는 T-test의 공식은 다음과 같다. <math>t = \frac{w_{AB} - \frac{w_Aw_B}{N}}{\sqrt{w_{AB}}}</math> * <math>N</math>: 말뭉치의 크기 * <math>w_{A}</math>: 말뭉치 전체에서 어휘 A의 빈도 * <math>w_{B}</math>: 말뭉치 전체에서 어휘 B의 빈도 * <math>w_{AB}</math>: 어휘 A의 양 옆에서 어휘 A와 B의 공기 빈도 == 같이 보기 == * [[관용구]](숙어) * [[존 루퍼트 퍼스]] * [[사전 편찬]] {{전거 통제}} {{토막글|언어학}} [[분류:낱말]] [[분류:형태론]] [[분류:말뭉치언어학]] [[분류:전산언어학]] [[분류:사전 편찬]] [[분류:의미 유사도]]
이 문서에서 사용한 틀:
틀:위키데이터 속성 추적
(
원본 보기
)
틀:전거 통제
(
원본 보기
)
틀:토막글
(
원본 보기
)
연어 (언어학)
문서로 돌아갑니다.
둘러보기 메뉴
개인 도구
로그인
이름공간
문서
토론
한국어
보기
읽기
원본 보기
역사 보기
더 보기
검색
둘러보기
대문
최근 바뀜
임의의 문서로
미디어위키 도움말
특수 문서 목록
도구
여기를 가리키는 문서
가리키는 글의 최근 바뀜
문서 정보