기타 업적

튜링상을 수상한 후에도 민스키의 연구는 정력적으로 계속되었다. 그리고 그의 연구는 인공 지능에만 한정되지 않았다. 여기서는 튜링상 수상과 직접적인 관련은 없지만 컴퓨터 과학 분야에 큰 영향을 주었던 활동을 몇 가지 살펴보고자 한다.

퍼셉트론

마빈 민스키와 시모어 페퍼트가 함께 쓴 <퍼셉트론>​6​은 인공지능 연구 역사에서 가장 큰 논쟁거리 중 하나였다. 신경망 모델에 빠져 인공지능의 세계로 들어왔던 마빈 민스키는 로젠블랫의 퍼셉트론 모델을 수학적으로 모델링하면서 그 한계를 지적했다.

1958년에 로젠블랫이 발표했던 퍼셉트론은 1951년에 민스키가 만들었던 SNARC와 유사한 개념을 가지고 있다. 신경망의 논리 동작에 사용되는 인자값을 반복적인 학습을 통해 보정해나가는 방식이다. SNARC에서는 각 뉴런에서 입력 단자의 신호를 출력 단자로 전달할 때 0에서 1 사이에 있는 확률값을 적용하는데 반복적인 학습을 통해 이 값은 보정된다. 퍼셉트론에서는 뉴런의 입력 신호(입력값)마다 적용되는 가중치weight들이 학습을 통해 결정된다.

만약 W * X + b > 0 이면 f(X) = 1 
그렇지 않으면            f(X) = 0

(여기서 X는 입력값의 벡터이다. 예를 들어 입력이 2개이면 X = [x1, x2]가 된다. 
그리고 W는 각 입력값에 가해지는 가중치 벡터이다. 입력이 2개이면 W = [w1, w2]가 된다.)

학습 데이터를 하나씩 적용할 때마다 W 값은 보정되는데 여기서 문제는 모든 학습 데이터를 적용하고 나면 과연 W 값이 특정 값으로 수렴하는가이다. 학습 데이터를 적용할 때마다 W 값이 널뛰듯이 바뀐다면 학습이 완료된 후에 얻는 W 값을 사용할 수가 없다. 민스키와 페퍼트는 W 가 특정 값으로 수렴하기 위해 학습 데이터가 가져야 할 조건을 찾았는데, 학습에 사용되는 입력 데이터들을 좌표평면 위에 놓았을 때 결과값을 1로 가지는 학습 데이터와 결과값을 0으로 가지는 학습 데이터가 하나의 직선으로 양분될 수 있어야 한다는 것이었다.

예를 들어 논리곱(AND) 연산을 퍼셉트론에 학습시킬 수 있는지를 생각해보자. 2개의 입력을 가지는 논리곱은 다음과 같은 표로 정의된다.

입력(x1)  입력(x2)    결과값
  0        0         0
  0        1         0
  1        0         0
  1        1         1

이제 위의 입력 데이터를 x1, x2 두 개의 좌표 축을 가지는 평면에 놓아보자. 해당 좌표에 놓을 때 점 대신 결과값을 표시하면 다음과 같다.

세 개의 0값 좌표와 1개의 1값 좌표를 구분 짓는 직선(그림에서 빨간색 선)을 그을 수 있으므로 논리곱은 퍼셉트론으로 구현이 가능하다.

그런데 모든 논리 연산이 퍼셉트론으로 구현 가능할까? XOR 연산을 퍼셉트론으로 구현할 수 있는지 따져보자. 2개의 입력을 가지는 XOR 연산은 아래와 같은 표로 정의된다.

입력(x1)  입력(x2)    결과값
  0        0         0
  0        1         1
  1        0         1
  1        1         0

이 네 개의 데이터를 좌표 평면에 놓아보면 다음과 같다.

2개의 0값 좌표와 2개의 1값 좌표를 구분지을 수 있는 직선은 불가능하다. 그림에서처럼 기괴한 곡선을 그려야만 가능하다. 따라서 XOR 연산에 사용할 수 있는 퍼셉트론 뉴런은 만들 수 없다는 의미이다. 민스키와 페퍼트는 퍼셉트론 모델에 대해 비관적인 입장을 보였고 이는 큰 파장을 불러오면서 신경망 모델 무용론이 확산되는 계기가 되었다.

하지만 일부 연구자들이 꾸준히 신경망 모델을 발전시키면서 다층으로 구성된 퍼셉트론 모델은 XOR을 구현해낼 수 있음을 보였다. 1987년에 퍼셉트론 개정판이 나오면서 민스키는 이 부분을 바로 잡았다.

흥미로운 점은 민스키와 로젠블랫이 가까운 사이였다는 것이다. 민스키는 브롱크스 과학 고등학교에서 로젠블랫의 1년 후배였다. 신경망 모델을 놓고 두 사람은 각각 비관론자와 낙관론자를 대변하며 학회에서 자주 논쟁을 벌였지만 사적으로는 가깝게 지냈다고 한다. 로젠블랫이 불의의 사고로 일찍 세상을 떠나지 않았다면 신경망 모델이 좀 더 일찍 두각을 내었을지도 모르겠다.


그렇다면 신경망 모델의 대안은 무엇일까? 그것은 흔히 기호주의 인공지능Symbolic AI이라고 부르는 것이다. 인간이 이해할 수 있는 기호를 사용하여 지능을 표현하고 구현하자는 것이다. 이 방식은 1960년대부터 1990년대까지 주류로 자리 잡았는데 민스키는 상식적인 지식Commonsense knowledge이라는 방법론을 강조했다. 사람이 어떤 상황에 반응할 때는 한 가지 과정process만 작용하는 것이 아니라 다양한 여러 과정들이 동시에 복합적으로 작용한다고 보았고, 그래서 어떤 입력에 대해 출력을 정의할 때 하나의 수학적 논리만으로 결정될 수 없다고 주장했다. 복합적으로 작용하는 다양한 과정들 각각은 그 과정의 특성에 맞게ad hoc 다루어져야 했다.

보통 사람이 일상생활에서 하는 일들은 20개 정도의 서로 다른 행위와 그들 사이의 관계로 구성됩니다… 예를 들어 내가 강아지를 바라볼 때 나는 그것이 물리적 객체임을 인식하면서 동시에 나의 머릿속에서는 그 개의 털이 무슨 색이고 몸무게가 어느 정도 나갈 것이고 하는 등등의 인식을 처리하고 있습니다.​11​

기호주의 인공지능의 또 다른 지지자였던 존 매카시는 수학 공식과 같은 논리를 기본으로 하고 싶어 했던 반면에 민스키는 다양한 방법론을 혼용하여 사용하는 방법을 지향했다. 매카시의 방법론을 사용하면 너무 많은 예외 상황을 처리하는 어려움을 겪게 된다고 민스키는 지적했다.​11​

1 2 3 4 5 6