검색 결과

둘러보기로 이동 검색으로 이동
  • ...외에도 연관 규칙은 오늘날 웹 사용 마이닝, 침입 탐지, 지속적인 생산, 생물 정보학을 포함하는 많은 응용 분야에서 사용된다. 시퀀스 마이닝(sequence mining)과 대조적으로 연관 규칙 학습법은 일반적으로 거래 내에서나 거래 사이에서의 항목의 순서를 고려하지 않는다. 연관 규칙 알고리즘 자체는 데이터 마이닝에 대한 전문 지식이 없는 사람들이 실행하기 어렵게 만들 수 있는 다양한 매개 변수로 구성되었고 이해하기 어려운 규칙이 많다. ...
    3 KB (65 단어) - 2022년 3월 8일 (화) 02:07
  • '''지도 학습'''({{lang|en|supervised learning}})은 훈련 데이터(Training Data)로부터 하나의 함수를 유추해내기 위한 [[기계 학습]](Machine Learning)의 한 방법이다. 훈련 * [[데이터 마이닝]] ...
    3 KB (136 단어) - 2023년 1월 21일 (토) 05:33
  • [[분류:데이터 마이닝]] ...
    3 KB (48 단어) - 2025년 2월 6일 (목) 15:40
  • ...수의 차원에도 적용이 가능하여 흔히 다차원의 양수 공간에서의 유사도 측정에 자주 이용된다. 예를 들어 [[정보 검색]] 및 [[텍스트 마이닝]] 분야에서, 단어 하나 하나는 각각의 차원을 구성하고 문서는 각 단어가 문서에 나타나는 회수로 표현되는 벡터값을 가진다. 이러한 다차 코사인 유사도는 [[데이터 마이닝]] 분야에서 [[클러스터]]들간의 응집도를 측정하는 방법으로도 사용된다.<ref>{{언어링크|en}} P.-N. Tan, M. Stei ...
    6 KB (218 단어) - 2023년 11월 11일 (토) 04:49
  • [[분류:데이터 시각화 소프트웨어]] [[분류:데이터 중심 프로그래밍 언어]] ...
    7 KB (308 단어) - 2025년 2월 14일 (금) 09:32
  • ...항목에 대한 [[관측값]]과 [[목표값]]을 연결시켜주는 예측 모델로서 [[결정 트리]]를 사용한다. 이는 [[통계학]]과 [[데이터 마이닝]], [[기계 학습]]에서 사용하는 예측 모델링 방법 중 하나이다. 트리 모델 중 목표 변수가 유한한 수의 값을 가지는 것을 [[분류 ...현하는데 사용된다. 다만, 데이터 마이닝의 결과로서의 분류 트리는 의사 결정 분석의 입력 값으로 사용될 수 있다. 이 페이지는 데이터 마이닝 분야에서의 결정 트리를 주로 다룬다. ...
    20 KB (773 단어) - 2024년 6월 3일 (월) 05:34
  • 알고리즘은 [[연산]], [[데이터 마이닝]]([[기계 학습]]) 또는 [[자동화된 추론]]을 수행한다. [[정지문제]]의 결과로 알고리즘을 멈추기까지 걸리는 시간을 일반적으로 ...]], [[그래프 이론|그래프 알고리즘]], [[문자열|문자열 알고리즘]], [[암호학|암호학적 알고리즘]], [[기계 학습]], [[데이터 압축]] 등. ...
    8 KB (283 단어) - 2025년 3월 17일 (월) 00:42
  • * Weka: WordVectords 및 단어주머니 모델을 자바로 구현한 널리 알려진 데이터 마이닝 패키지 ...p://scgroup.hpclab.ceid.upatras.gr/scgroup/Projects/TMG/}}: 다음과 같은 다양한 텍스트 마이닝 작업에 사용될 수 있는 MATLAB 툴박스 - 1)색인, 2)검색, 3)차원 절감, 4)클러스터링, 5)분류. TMG의 대부분은 MA ...
    9 KB (463 단어) - 2025년 3월 14일 (금) 03:27
  • '''통계학'''(統計學, {{llang|en|statistics}})은 산술적 방법을 기초로 하여, 주로 다량의 [[데이터]]를 관찰하고 정리 및 분석하는 방법을 연구하는 [[수학]]의 한 분야이다. 근대 과학으로서의 통계학은 19세기 중반 [[벨기에]]의 ...는 [[데이터]]로부터, 응용 수학의 기법을 이용해 수치상의 성질, 규칙성 또는 불규칙성을 찾아낸다. 통계적 기법은, 실험 계획, [[데이터]]의 요약이나 해석을 실시하는데 있어서의 근거를 제공하는 학문이며, 폭넓은 분야에서 응용되어 실생활에 적용되고 있다.<ref name= ...
    29 KB (491 단어) - 2025년 3월 13일 (목) 08:24
  • * 비음수 행렬 분해는 완화된 형태의 k 평균 알고리즘으로 동일시 할 수 있다. 이는 비음수 행렬 분해를 데이터 군집화에 사용하는 이론적 토대가 된다. 그러나 k-평균 알고리즘은 비음수이라는 제약 조건을 가지고 있지 않다는 차이가 있다. === 텍스트 마이닝 === ...
    18 KB (989 단어) - 2024년 5월 17일 (금) 04:07
  • ...단체 복합체의 단체 호몰로지를 자동으로 효율적으로 계산할 수 있기 때문에 단체 호몰로지는 상 분석, [[의학촬영|의료 영상]] 및 [[데이터 분석|자료 분석]] 전반과 같은 실생활에 적용하는 데 중요해졌다. ...지는 단체 복합체와 같은 조합 데이터에서 쉽게 계산할 수 있기 때문에 이러한 기능을 검색하는 정성적 도구 역할을 할 수 있다. 그러나 데이터 점은 먼저 삼각분할 되어야 한다. 즉, 데이터를 단체하고 복잡한 근사치로 대체해야 한다. 지속적인 호몰로지 계산<ref>{{저널 인용| ...
    16 KB (878 단어) - 2025년 3월 14일 (금) 09:32
  • 최근접 이웃 탐색문제는 [[최적화 문제]]의 하나로, n개의 데이터가 주어져있을 때, 어떠한 요청에 대한 응답으로 n개의 데이터 중 가장 비슷한 것을 고르는 문제이다. 이 때, 데이터는 ''R<sup>d</sup>'' 공간 위 점으로 표현된다. 가장 비슷한 점은 '''최근접 이웃 탐색'''의 적용 분야는 다양하다. 데이터 압축, [[데이터베이스]], [[데이터 마이닝]], [[정보 검색]], [[기계 학습]], [[패턴 인식]], [[통계학]]의 분야에서 사용될 수 있다. 예컨대, [[최근접 이웃 규 ...
    28 KB (1,412 단어) - 2025년 3월 13일 (목) 15:19
  • '''k-평균 알고리즘'''({{Lang|en|K-means clustering algorithm}})은 주어진 [[데이터]]를 k개의 [[클러스터]]로 묶는 알고리즘으로, 각 클러스터와 거리 차이의 [[분산]]을 최소화하는 방식으로 동작한다. 이 알고리즘은 ...tion) 을 최소화하는 방식으로 이루어지며, 이 과정에서 같은 그룹 내 데이터 오브젝트 끼리의 유사도는 증가하고, 다른 그룹에 있는 데이터 오브젝트와의 유사도는 감소하게 된다.<ref name="HanJiawei">{{서적 인용 ...
    51 KB (2,580 단어) - 2024년 8월 19일 (월) 15:11
  • ...주성분으로 놓이도록 새로운 좌표계로 데이터를 [[선형 변환]]한다. 이와 같이 표본의 차이를 가장 잘 나타내는 성분들로 분해함으로써 데이터 분석에 여러 가지 이점을 제공한다. 이 변환은 첫째 주성분이 가장 큰 분산을 가지고, 이후의 주성분들은 이전의 주성분들과 직교한다는 제 주성분 분석은 실제 고유 벡터 기반의 다변량 분석들 중 가장 간단한 방식이다. 만약 다변량 데이터 집합이 변수당 1개의 축이 있는 높은 차원의에서 보았을 때 단순히 좌표의 집합으로 보인다면, 주성분 분석은 이를 낮은 차원으로 끌어내려 ...
    63 KB (3,187 단어) - 2025년 3월 13일 (목) 13:04
  • * [[웹 마이닝]] | 부호단어(codeword) || 단어(word) || LDA 모형의 가장 기본적인 이산 데이터 단위 <math>x \in \{1,\dots,V\}</math> ...
    42 KB (3,492 단어) - 2024년 6월 1일 (토) 06:36
  • ...]]과 교사 신호를 필요로 하지 않는 [[비교사 학습|비지도 학습]]으로 나뉘어 있다. 명확한 해답이 있는 경우에는 교사 학습이, [[데이터 클러스터링]]에는 비교사 학습이 이용된다. 인공신경망은 많은 입력들에 의존하면서 일반적으로 베일에 싸인 함수를 추측하고 근사치를 낼 경 ...해질수록 뉴런 층의 수도 더 많아지고, 그 층 안에 있는 입력 뉴런과 출력 뉴런들의 수도 많아질 것이다. 이 시냅스들은 계산 과정에서 데이터 값을 조절하는 가중치 값을 저장한다. ...
    61 KB (2,389 단어) - 2025년 3월 13일 (목) 11:46