본 문서에선 사후분포를 근사하기 위한 가장 대표적인 방법인 라플라스 근사에 대해 알아본다.
•
복잡한 확률분포를 가우시안 분포로 근사하는 방법
•
고차원 분포를 다루기 쉬운형태로 근사하며 사후분포를 근사하기 위한 대표적인 방법 중 하나
•
unimodal function과 같은 well-behaved function에서 잘 동작함
라플라스 근사(Laplace approximation)
아래와 같이 well-behaved function이고 모드가 인 함수 에 대해 를 구해보자.
라 하면 =이다. 이를 테일러급수(Taylor series)를 통해 2차식까지 근사하면 아래와 같다.
이 때 는 극값이므로 을 만족한다. 이를 통해 다시 전개하면 아래와 같다.
여기서 는 상수이므로 적분식 밖으로 뺄 수 있고 이를 이용하면 아래와 같이 전개할 수 있다.
여기서 은 평균이 이고 분산이 인 정규분포와 같다. 이런 분포를 라 하고 임을 이용하면 최종적으로 식을 아래와 같이 정리할 수 있다.
만약 이고 라면 의 적분값은 1이 되므로 아래와 같이 계산된다.
즉, 라플라스 근사는 “함수의 적분 문제”를 “함수 최대값 찾기 문제”로 바꿔준다. 라플라스 근사를 계산하기 위해 모드의 위치를 알아야 하고 이는 곧 최적화 문제(optimization problem)에 해당한다. 일반적으로 적분을 계산하는 것 보다 최적화 문제를 푸는게 빠르므로 라플라스 근사를 이용하면 더 효율적으로 문제를 해결할 수 있게된다.
다음은 위 개념을 이용해서 사후분포의 평균(Posterior Means)을 계산해본다.
사후분포 평균(Posterior Means) 계산
를 관측데이터라 하고 는 파라미터 에 대해 인 분포를 가지며 의 사전분포가 라 하자. 이 때 사후분포를 라하면 평균은 아래와 같다.
베이즈 정리에 의해 이다. 이를 위 식에 대입하면 아래와 같다.
여기서 는 상수이므로 적분바깥으로 뺄 수 있고 이를 이용해서 정리하면 아래와 같다.
라 하자. 위에서 설명한 라플라스 근사와 같은 과정을 진행한다. 는 단순히 사후분포의 밀도에 비례하는 단조함수이므로 는 사후분포의 모드값에서 최대값을 가짐을 알 수 있다.
를 사후분포 의 모드값이라 하면 아래와 같이 근사할 수 있다.
분모인 는 정규분포를 전체구간에서 적분한 값이므로 1이 되고 는 의 기댓값이므로 가 된다. 따라서 최종적으로 정리하면 아래와 같다.
따라서 사후분포 평균의 라플라스 근사값은 사후분포의 모드값과 같다.
라플라스 근사의 경우 unimodal 함수나 대칭함수에 잘 동작하며 특히 분포가 평균 근처에 잘 모여있을 수록 성능이 좋아진다. 이를 토대로 적절한 함수에 적용하면 좋은 결과를 얻을 수 있다.