검색 결과

둘러보기로 이동 검색으로 이동
  • ...[[통계학]], [[유전 알고리즘]] 등의 분야에서도 연구된다. 운용 과학과 제어 이론에서 강화 학습이 연구되는 분야는 "근사 동적 계획법"이라고 불린다. 또한 최적화 제어 이론에서도 유사한 문제를 연구하지만, 대부분의 연구가 최적해의 존재와 특성에 초점을 맞춘다는 점에서 기본적으로 강화 학습의 문제는 [[마르코프 결정 과정]](MDP)으로 표현된다. 이런 관점에서 강화 학습 알고리즘은 [[동적 계획법]]과 깊은 연관이 있다. 마르코프 결정 과정에서 상태 전이 확률(state transition probabilities)과 보상은 확률 ...
    6 KB (189 단어) - 2024년 10월 2일 (수) 08:26
  • 함수 방정식의 일부 부류에 대해서는 컴퓨터를 이용한 자동 풀이가 개발되고 있다. [[동적 계획법]]에서 함수 방정식의 해를 근사하는 연구가 활발히 이루어진다. ...
    3 KB (91 단어) - 2024년 5월 8일 (수) 09:58
  • ...도 1950년대에 처음 고안되었으며, 마르코프 결정 과정에 대한 가장 핵심적인 연구는 1960년에 출판된 [[로널드 하워드]]의 책 《동적 계획법과 마르코프 과정》(''Dynamic Programming and Markov Processes'')<ref name=":0">{ 마르코프 결정 과정은 [[선형 계획법]] 혹은 [[동적 계획법]]을 사용하여 풀 수 있다. 다음에서 서술하고 있는 것은 동적 계획법에 관련된 것이다. ...
    10 KB (469 단어) - 2023년 11월 30일 (목) 08:41
  • ...맥 자유 문법]]에 속하는지를 판단하고, 또한 어떠한 방식으로 생성되는지를 판단하는 [[파싱]] 알고리즘이다. 이 알고리즘은 [[동적 계획법]]을 사용하며, [[상향식 파싱]] 구조를 가지고 있다. ...
    3 KB (341 단어) - 2022년 3월 23일 (수) 14:38
  • ...책에 따라 환경을 [[표집]]하여 학습을 진행하는 몬테 카를로 방법의 특징과, 과거에 학습한 추정치를 사용하여 현재의 추정치를 구하는 동적 계획법의 특징을 지니고 있기 때문이다. 시간차 학습 알고리즘은 동물들의 시간차 학습 모델과도 관련이 있다.<ref name="WSchu ...
    5 KB (276 단어) - 2025년 3월 13일 (목) 15:11
  • [[분류:동적 계획법]] ...
    4 KB (435 단어) - 2022년 2월 26일 (토) 16:47
  • * [[최적화 문제]] : [[선형 계획법]], [[동적 계획법]], [[탐욕 알고리즘]], [[휴리스틱 함수]] 등. ...
    8 KB (283 단어) - 2025년 3월 17일 (월) 00:42
  • ...ACM 프레스| 위치 = New York, NY, USA}}</ref>. 그러나 주어진 수열의 개수가 일정할 때 이 문제는 [[동적 계획법]]에 의해 다항 시간 안에 풀린다. 각각의 길이가 <math>n_1, \dots, n_N</math>인 <math>N</math>개의 ...에서, 동적 계획법에 의한 실행 시간은 [[Big O notation|O]](''n'' × ''m'')이다. 임의의 입력 수열에 대해 동적 계획법에 의한 실행 시간은 다음과 같다. ...
    29 KB (2,078 단어) - 2024년 12월 20일 (금) 01:39
  • 플로이드-워셜 알고리즘은 [[동적 계획법]]의 한 예로, [[로버트 플로이드]]가 1962년에 현재 알려진 형태로 발표했다.<ref>{{저널 인용| first = Robert [[분류:동적 계획법]] ...
    21 KB (1,350 단어) - 2024년 5월 18일 (토) 11:50
  • ...볼 수 있다: [[최단 경로 문제#선형 계획법 공식|최단 경로의 계산에서 선형 계획법]]이 있고, 그 [[쌍대성 (최적화)|쌍대 선형 계획법]]의 해법이 실행 가능하다는 것은 [[일관 휴리스틱]]을 형성한다는 것이다(대략적으로 말하면, 서명 관례가 문헌마다 다르기 때문이다). === 동적 계획법의 관점 === ...
    48 KB (2,514 단어) - 2025년 3월 13일 (목) 18:54
  • ...n'') || ''n'', ''n''&nbsp;log&nbsp;''n'', ''n''<sup>10</sup></sup> || [[선형 계획법]]을 위한 [[카르마카의 알고리즘|카르마카(Karmarkar)의 알고리즘]], [[AKS 소수판별법]] ...<sup>''O''(''n'')</sup> || 1.1<sup>''n''</sup>, 10<sup>''n''</sup> || [[동적 계획법]]을 사용한 [[외판원 문제]] 해결방법 ...
    32 KB (1,049 단어) - 2025년 1월 11일 (토) 12:45
  • ...이 [[마르코프 과정]]을 통해 도출된 결과들만이 관찰될 수 있기 때문에 '은닉'이라는 단어가 붙게 되었다. 은닉 마르코프 모형은 [[동적 베이지안 네트워크]]로 간단히 나타낼 수 있으며, 은닉 마르코프 모형의 해를 찾기 위해 [[전향-후향 알고리즘]]을 제안한 스트라토노빅 ...면서 은닉 마르코프 모형에 대한 연구가 활발히 진행되기 시작하였다. 1967년 [[앤드루 비터비]](Andrew Viterbi)는 [[동적 프로그래밍]]을 이용하여 관찰된 사건들이 도출될 확률이 가장 높은 은닉 상태들의 순서를 찾아내는 [[비터비 알고리즘]]을 발표하였다. ...
    77 KB (4,000 단어) - 2025년 3월 13일 (목) 15:32
  • ...기 후반 if-then 규칙으로 표현된 지능을 가진 [[전문가 시스템]]을 특징으로 하는 고차원(symbolic) 인공지능에서부터 [[동적 시스템]]의 매개변수들을 가진 지능을 특징으로 하는 저차원(sub-symbolic) [[기계학습]]으로 가는 패러다임의 변환이다. ...=16 |pages=241–251 |doi=10.1016/0098-1354(92)80045-B |issue=4}}</ref> [[동적 계획법]]은 베르트세카스(Bertsekas)와 치치클리스(Tsitsiklis)<ref>{{서적 인용| author = Bertsekas, D. ...
    61 KB (2,389 단어) - 2025년 3월 13일 (목) 11:46
  • * 그래프가 선형 체인이거나 트리일 때, 추론 작업은 [[은닉 마르코프 모델]]을 위한 다양한 동적 계획법 알고리즘을 이용해 효율적으로 정확하게 수행 가능하다. 그런 알고리즘의 예로는 [[전향-후향 알고리즘]]({{llang|en|forwar ...
    33 KB (1,876 단어) - 2025년 3월 13일 (목) 15:15