헤세 행렬 예제

헤시안 행렬은 스칼라 함수의 두 번째 정렬된 부분 미분의 제곱 행렬입니다. 그것은 선형 대수뿐만 아니라 로컬 최대값 또는 최소의 점을 결정하기위한 엄청난 사용이다. 두 번째 유도체 테스트는 경계 헤시안의 특정 집합의 결정자의 기호 제한으로 구성됩니다 – m 서브매트릭스. [8] 직관적으로 m 제약 조건은 n – m 자유 변수가 있는 문제로 문제를 줄이는 것으로 생각할 수 있습니다. (예를 들어 제약 조건 x1+x2+x3 = 1을 제약 조건없이 f(x1, x2, 1-x1-x2)의 최대화로 줄일 수 있습니다.) 이 텐서 m = 1 일 때 일반적인 헤시안 행렬로 퇴화됩니다. 볼록 함수의 헤시안 행렬은 양수 반정선입니다. 이 속성을 구체화하면 임계 점 x가 로컬 최대, 로컬 최소 값 또는 안장 점인지 테스트할 수 있습니다. , f의 헤시안은 D에 걸쳐 대칭 행렬이다; 두 번째 파생 상품의 대칭을 참조하십시오. f가정 : Rn → R은 벡터 x를 입력하고 스칼라 f(x)를 산출하는 함수입니다. f의 모든 두 번째 부분 파생이 존재하고 함수의 도메인을 통해 연속하는 경우, f의 헤시안 매트릭스 H는 일반적으로 다음과 같이 정의되고 정렬 된 사각형 n × n 행렬입니다 : 수학에서 헤시안 행렬 또는 헤시안은 사각형 행렬입니다. 스칼라 값 함수 또는 스칼라 필드의 2차 부분 파생 상품입니다.

많은 변수 함수의 로컬 곡률을 설명합니다. 헤시안 매트릭스는 독일의 수학자 루드비히 오토 헤세에 의해 19 세기에 개발되었으며 나중에 그의 이름을 따서 명명되었습니다. 헤세는 원래 “기능 적 결정자”라는 용어를 사용했습니다. 위의 행렬의 결정인을 헤시안이라고도 합니다. [1] 다음 예제에서는 사실을 명확하게 설명하고 용도를 설명합니다. 여기서 □f는 그라데이션(∞f/∞x1, …, f/∞xn)입니다. 전체 Hessian 행렬을 계산하고 저장하려면 Θ(n2) 메모리가 필요하며, 이는 신경망의 손실 함수, 조건부 임의 필드 및 많은 수의 매개 변수가 있는 기타 통계 모델과 같은 고차원 함수에 사용할 수 없습니다. 이러한 상황에서는 잘린 뉴턴 및 준 뉴턴 알고리즘이 개발되었습니다.