공학 확률 - (1) 확률과 확률변수(Random variable)

 필자가 연구하는 의료영상 분야 및 많은 공학 연구분야에서 머신러닝이나 딥러닝분야가 크게 떠오르면서 기반이되는 확률에 대한 이해가 매우 중요해졌다. 그래서 확률에 대해 공부한 내용을 정리할겸 글을 써보려고 한다. 쉽게 쉽게 쓰고  필요한 부분만 언급하고 싶지만 개념은 가벼우면서도 넓게 이해하는 것이 중요하므로 꼭 한번은 알아야 할 부분은 언급하고 넘어가겠다.

(이 글의 상당부분은 Henry Stark과 John W. Woods의 Probability, Statistics, and Random Processes for Engineers 책을 기반으로 하고 있다.) 

 

1. 확률이란?

 

 

 우리가 확률을 사용하는 이유는 무엇인까? 확률은 우리가 많은 상황에서 모든 것을 정확하게 계산하는 것이 불가능하기 때문에 사용하는 개념이다. 간단한 예를 들어, 주사위를 던질 때 어떤 숫자가 나올지 우리는 알지 못한다. 엄밀히 말해서 사람의 뇌로 주사위를 던지는 짧은 순간에 손에서 주사위로 전달되는 힘, 던지는 각도, 초기 주사위의 위치 등 모든 것을 고려하여 주사위가 어떤 숫자로 나올 것인가를 계산하는 것은 불가능하다. 하지만 '충분히 큰 n번이란 횟수동안 주사위를 던지면, 각 숫자가 약 \( \frac{n}{6} \)번 정도 나올 것이다.' 정도의 유의미한 추측은 가능하다. 또 다른 예로 포커가 있다. 카드를 섞을 때, 모든 카드의 순서를 외워서 상대방의 카드를 추측하는 것은 불가능하다. 우리가 할 수 있는 것은 내가 가지고 있는 패, 그리고 깔려있는 패를 통해서 상대방이 어떤 숫자를 높은 확률로 가지고 있을지 예상할 수 있다.

 확률의 이용은 우리가 결정적으로 해석하는 것이 불가능한 많은 문제에 대해서 평균적 의미(average sense)로 해석하고자 하는 노력이다.

 

◈ 신호처리 분야에서의 확률

 확률적인 접근은 신호처리 분야에서 효과적인 방법이다. 그 이유는 신호측정 장비 혹은 영상촬영 장비를 통해서 얻어진 신호 정보에는 필연적으로 노이즈를 포함하게 되는데, 확률적인 접근은 이런 노이즈를 복잡한 물리적인 해석없이 간단한 가정을 통해서 평균적인 처리를 가능하게 하기 때문이다.

 간단한 예로 우리가 영상의 노이즈를 제거할 때에 사용되는 필터 중에 가장 대표적인 필터가 가우시안 필터(Gaussian filter)이다. 가우시안 필터는 영상의 노이즈를 실제 신호를 중심(혹은 평균)으로 하는 가우시안 노이즈로 가정하여 탄생된 필터이다 (물론 가우시안 필터는 모든 픽셀 신호의 평균이 같다는 가정을 포함하고 있으므로 확률 관점에서 효과적으로 설계된 방법은 아니다.).

 

<원본 CT영상(좌), 가우시안 노이즈 첨가 CT영상(중), 가우시안 필터 후 CT영상(우)>

 

 

2.  확률 변수(Random variable)

 

 확률변수(Random variable)는 우리가 확률을 공학적으로 이용하기 위한 중요한 개념이다. 사실 어렵게 설명하면 매우 헷갈리는 개념이라 최대한 간단하게 설명하도록 노력하겠다. 한 마디로 확률변수를 이야기하자면 확률변수는 무작위로 발생하는 결과 혹은 현상을 수치적인 형태로 대응시키는 함수이다.

 

 확률변수를 정의하기 위해서는 확률 공간에 대해서 정의해야 한다. 확률 공간은 3가지로 정의된다. 표본 공간(Sample space), 시그마-체(Sigma-field), 확률 측정(Probability measure)이다.

 

 표본 공간(Sample space, \( \Omega \))은 실험에서 나올 수 있는 모든 결과를 원소(\( \zeta \))로 가지는 공간을 말한다. 여기서 원소들은 숫자가 될 수도 있고 어떤 행위가 될 수 있다.
 예를 들어서 가위바위보를 생각해보자. 상대가 낼 수 있는 모든 경우의 수가 표본 공간에 포함된다. 이때 표본공간은 \( \Omega = \left\{ 가위, 바위, 보\right\} \) 가 된다.
 시그마-체(Sigma-field, \( \mathcal{F}\))는 표본 공간의 모든 부분집합(subset)을 원소로 가지고 있는 집합이다.
 위의 예에서 따지자면 \( \mathcal{F} = \left\{ \phi, \left\{ 가위 \right\}, \left\{ 바위 \right\}, \left\{ 보 \right\}, \left\{ 가위, 바위 \right\}, \left\{ 바위, 보 \right\}, \left\{ 가위, 보 \right\}, \left\{ 가위, 바위, 보 \right\} \right\} \) 이다.
 확률 측정(Probability measure, \( P \))는 위의 시그마-체의 모든 원소를 정의역으로 가지는 확률함수이다. 항상 \( 0\le P \le 1 \)를 만족해야 한다.
 예를 들어 가위, 바위, 보 중에서 하나가 나올 확률이 100%이므로 \( P(\left\{ 가위, 바위, 보 \right\}) = 1 \) 이고 그 반대로 하나도 나오지 않을 확률은 \( P(\phi) = 0 \) 이 된다.

 

 확률변수는 위 \( \left( \Omega, \mathcal{F}, P \right)\)를 정의역으로 정의되는 함수이다. 함수를 정의할 때, 해당 정의역에 대해서 명확한 언급을 하는 것과 같이 확률변수에 대해서 정의할 때에도 위 3가지 정의역에 대해서 최대한 자세히 정의해야 한다.

아래 그림은 확률변수의 역할을 다소 직관적으로 보여주는 그림이다. 확률변수를 이용하면 표본 공간 안의 수치화되어있지 않거나 무작위의 표본들을 1차원 실수공간에 맵핑(mapping) 할 수 있다.

(1차원 실수 내의 특정 범위를 Borel field, \(B \) 라 부르고 이에 대응되는 \( E_{B} \)는 inverse image of the \(B \)라고 부른다.)

 

<확률변수(X)의 역할을 표현하는 모식도>


 

끝으로

 

 이번 글에서는 확률의 필요성과 확률변수를 이해하기 위한 기본 개념을 다루었습니다. 사실 확률변수가 어떻게 쓰이는지 알지만 확률변수에 대한 이해가 깊지 않은 분에게는 도움이 되겠지만 확률변수가 무엇인지 전혀 모르시는 분들은 이게 도대체 뭐지? 라는 생각이 들 수 있습니다. 그래서 다음 글에서는 확률변수의 추가적인 개념과 이를 이용하여 생각할 수 있는 공학적 예제를 간단하게 소개하도록 하겠습니다. 감사합니다.

 

 

 

※ 본 글이 도움되었다면 하트 클릭 부탁드립니다!

(비로그인으로도 가능합니다! )

댓글

Designed by JB FACTORY