조건문을 해석하는 방향은 반드시 실질조건문의 방식만 존재하는 것도 아니고 자연언어의 조건문과의 차이를 설명하는데에 반드시 Grice의 conversational implicature가 필요한 것도 아닙니다. 이번에는 조건문을 조건부확률로 설명하는 Ramsey's test를 보도록 하겠습니다. 그에 앞서 우선 conversational implicature에 대한 비판을 보도록 하도록 하겠습니다.

0. A→B ∨ B→A
 실질조건문으로 해석하면 이 문장은 언제나 참입니다. 왜냐면 A가 참이면 뒷부분의 선언지가 참이 되고, A가 거짓이면 앞부분의 선언지에 나타난 조건문의 전건이 거짓이기 때문에 A→B는 참이게 되므로 따라서 위의 문장은 A와 B가 어떤 문장이든간에 항상 참이 됩니다. Grice의 conversational implicature는 선언지가 진리함수적(즉 A or B가 참이라는 말은 A와 B 중에서 적어도 하나 이상은 참이라는 것)이라는 전제를 가지고 있는데, 자연언어에서는 언제든지 위의 문장의 양 선언지가 거짓이 되게 할 수 있습니다. 가령 A = I am right, B = you are right이면, 0의 문장은 if I am right, then you are right, or if you are right, then I am tight이 됩니다. 내가 옳으면 너도 옳고, 네가 옳으면 나도 옳다는 문장입니다. 0은 실질조건문에 의해 항상 참인 문장이므로 이 문장은 언제나 참입니다. 제가 내년에 한국이 멸망한다고 말하고, '너'로 지칭되는 사람이 내년이 아니라 내후년에 한국이 멸망한다고 주장한다고 합시다. 그렇다면 위의 문장에 따라 내년에 한국이 망하면 내년에 망하지 않고 내후년에 망하거나 내년에 망하지 않고 내후년에 한국이 망하면 한국은 내년에 망한다는 문장이 형성됩니다. 이는 논리적으로 모순을 안고있는 것처럼 보이지만 실질조건문을 받아들이면 참인 문장으로 받아들여야 합니다. 따라서 선언지는 진리함수적으로 분석할 수 없습니다.

위의 논증을 받아들여서 implicature를 폐기한다고 한다면 우리는 자연언어 조건문 = 실질조건문을 받아들여야 하는 걸까요? 이에 대해서 조건문을 조건부확률로 이해하는 이론이 제시될 수 있습니다.

1-0. 확률론의 공리들(kolmogorov axioms)
 이하의 내용을 좀더 정확히 이해하기 위해서는 확률론의 공리를 볼 필요가 있습니다. Pr은 명제 혹은 문장들의 집합에서 [0,1]로 가는 함수입니다. Sent(L)이 모든 문장들의 집합이라면 Pr:Sent(L)->[0,1]이라고 표기할 수 있습니다. 확률론에서는 문장을 사건(event)로 해석합니다. 이 전통에 따라 문장(혹은 명제)와 사건을 구분해서 쓰지 않겠습니다. 이 함수에 대한 공리는 세 가지가 있습니다.

1. 0Pr(A)1
2. if A is tautology, Pr(A)=1
3. Pr(AvB)=Pr(A)+Pr(B) if A and B are mutually exclusive(i.e., ~(A&B))

1.어떤 사건에 대한 확률은 항상 0에서 1사이에 존재한다는 것입니다.
2. 동어반복/논리적으로 참(tautology)인 문장은 항상 발생하는 사건입니다. 가령 A v ~A나 A->A같은 문장들은 확률이 1입니다.
3. A와 B가 mutually exclusive라는 말은 A&B가 거짓이라는 말입니다. ~(A&B)입니다. A와 B가 동시에 성립할 수 없다는 의미입니다. 명제와 집합은 다르기 때문에 정확한 표현은 아니지만, A와 B를 집합으로 이해한다고 하면 두 집합이 서로 교집합이 없는 경우라고 생각할수도 있겠습니다.


 우리가 아는 조건부확률은 확률함수 Pr이 주어져있을 때 정의되는데, Pr이 정의되어있을 때 Pr(B,A)라는 이항함수는 Pr(B/A)로 표기되고 Pr(A&B)/Pr(B)로 정의됩니다. Pr(B/A)는 조건부확률함수입니다. A가 일어났을 때 B가 일어날 확률을 뜻합니다. A가 일어났을 때 B가 일어날 확률을  Pr(B)/Pr(A)로 하지 않느냐를 물을 수 있습니다만, B가 일어날 확률은 두 가지로 생각할 수 있기 때문입니다. B와 A가 일어나는 확률, B가 일어나지만 ~A가 일어나는 확률. 따라서 Pr(B)/Pr(A)로 조건부확률을 정의하면 분자에는 A가 일어나지 않을 확률도 동시에 포함되기 때문에 올바른 정의가 되지 않습니다. 따라서 A가 일어났을 때 B가 일어날 확률은 Pr(A&B)/Pr(A)로 정의합시다. A와 B를 집합으로 생각하고 밴다이어그램을 그려보면 이해가 빠르실겁니다.

 이때 주목해야할 것은 조건부확률함수를 통해 새로운 확률함수를 만들 수 있다는 것입니다. 가령 기존의 확률함수에서 Pr(A)가 0이 아니라고 가정하고 A를 고정시켰을 때 PrA라는 함수를 PrA(B)=Pr(B,A)=Pr(B/A)로 정의할 수 있습니다. A가 발생했다고 가정할 때 만들어지는 사건들에 대한 확률함수입니다. 해보시면 알겠지만 PrA는 확률의 세 가지 공리를 모두 만족합니다.

 위의 공리들에 의해 다음과 같은 정리들을 증명할 수 있습니다. 임의의 확률함수 Pr에 대해서

a. Pr(~A)=1-Pr(A)
b. A와 B가 논리적 동치라면 Pr(A)=Pr(B)
c. Pr(AvB)=Pr(A)+Pr(B)-Pr(A&B)
d. A→B가 논리적 참이라면 Pr(A)≤Pr(B)

a. 2에 의해 Av~A는 논리적 진리이므로 1=Pr(Av~A)이고 A와 ~A는 동시에 성립할 수 없으므로(mutually exclusive) 3에 의해 1=Pr(Av~A)=Pr(A)+Pr(~A)입니다. 따라서 Pr(~A)=1-Pr(A)입니다.
 a에 의해서 논리적 모순인 문장들은 확률이 0임을 알 수 있습니다. 명제논리적으로 A가 논리적 모순이라면, ~A는 논리적 진리이기 때문입니다. 즉, Pr(~A)=1-Pr(A)=1이므로 Pr(A)=0입니다. 따라서 불가능한 사건(논리적 모순)을 지칭하는 확률값은 0이고 항상 발생하는 사건을 지칭하는 확률값은 1입니다.

b. A와 B가 논리적 동치라면 A<->B는 논리적 참입니다. 따라서 A와 ~B는 동시에 성립할 수 없습니다. 또한 Av~B도 논리적 참입니다(A이거나 A가 아닌데, A가 아니라면 ~A인데 ~A는 ~B와 동치이므로 Av~B). 따라서 3에 의해서 1=Pr(Av~B)=Pr(A)+Pr(~B)이고 a에 의해 Pr(~B)=1-Pr(B)입니다. 따라서 1=Pr(A)+1-Pr(B)이고 Pr(A)=Pr(B)입니다.

c. 우리가 아는 건 A와 B가 동시에 성립할 수 없을 때 Pr(AvB)=Pr(A)+Pr(B)라는 것입니다. 이를 활용하여 증명합니다. AvB를 쪼개서 생각합시다. 집합으로 생각하면 v를 합집합기호로 생각해서 서로 겹치는 부분을 따로 떼내어 생각합시다. 즉, AvB를 (A&~B v A&B) v (~A&B v A&B)로 쪼갭시다. 겹치는 부분을 제외하면 (A&~B v A&B) v ~A&B입니다(AvB와 동치). 선언지의 각각의 부분은 서로 동시에 성립할 수 없습니다.
 Pr(AvB)=Pr( ((A&~B) v (A&B)) v (~A&B) )이고, 이제 3을 이용하면
Pr(AvB)=Pr(A&~B v A&B)+Pr(~A&B)입니다. A&~B v A&B는 A와 동치이므로 b에 의해
Pr(AvB)=Pr(A)+Pr(~A&B)입니다. 3의 형태를 최대한 유지하기 위해서 Pr(B)의 식을 Pr(~A&B)를 활용해서 만들어봅시다.
논리적 동치를 활용하면 3에 의해 Pr(B)=Pr(~A&B)+Pr(A&B)이므로 위의 식에 대입하면
Pr(AvB)=Pr(A)+Pr(B)-Pr(A&B)가 됩니다.

d. A→B가 논리적 참이라고 합시다. 그렇다면 1=Pr(A→B)=Pr(~AvB)=Pr(~A)+Pr(B)-Pr(~A&B)입니다. 식을 정리하면 1= 1-Pr(A)+Pr(B)-Pr(~A&B)이 되고 Pr(A)=Pr(B)-Pr(~A&B)입니다. 다시 정리하자면 Pr(B)=Pr(A)+Pr(~A&B)입니다. 1에 의해 확률값은 0과 1사이에 있으므로 Pr(A)≤Pr(B)입니다.

 이 결과들을 가지고 이제 자연언어의 조건문을 조건부확률로 생각해봅시다.

1-1. Ramsey's test
 Ramsey's test는 조건문을 받아들이냐 마냐하는 문제는 기존의 믿음체계에 조건문의 전건을 추가했을 때 후건을 받아들일 수 있는지 아닌지에 달려있다는 테제입니다. 이 테제를 해석하는 방법은 두 가지가 있습니다만 이번 글에서는 Stalnaker's Hypothesis를 소개하도록 하겠습니다.

1-2. Stalnaker's Hypothesis

Stalnaker's Hypothesis :  Pr(if A then B)=Pr(A→B)=Pr(B/A)

 말하자면, 조건문이 얼마나 받아들일만한가는 A를 참으로 받아들였을 때 B가 얼마나 그럴듯하냐에 따라 달린 것으로 보는 것입니다. 달리 말하면, A를 믿음체계 속에 받아들였을 때 다른 믿음들과 A로부터 B를 얼마나 받아들일 수 있는가를 조건문의 신뢰도로 정의하는 것입니다. 가령 박근혜가 탄핵되지 않았다면 제19대 대한민국 대통령은 자유한국당에서 나왔을 것이다는 문장을 봅시다. 이 문장이 얼마나 신뢰할 수 있는가, 얼마나 받아들일 수 있는가는 박근혜가 탄핵되지 않았다고 할 때, 여러가지 정황들과 사실들, 믿음들로부터 19대 대통령이 자유한국당에서 나올 가능성이 얼마나 되는가로 측정할 수 있습니다. 물론 현실은 아주 다양한 변수들이 있고 그 변수들을 모두 알 수는 없기 때문에 실질적 측정은 어려울지라도 말입니다.

 조건문에 대한 이런 해석은 가상법적 조건문을 설명하기에 좋습니다. 가령, '내가 너였다면 그렇게 하지 않았을 것이다'는 문장의 의미를 생각해볼 수 있습니다. 이 문장을 내가 너와 유사한 상황에 처해있었다면 나의 성격과 여러 믿음들로 인해 어떤 행동을 할 가능성이 높다는 말로 이해할 수 있을 것입니다(물론 현실에서는 그런 행동을 하는 것이 좋지 못하다는 의미를 함축합니다만). 물론 가상법 외에도 예측 등으로도 사용할 수 있습니다. 가령 북한이 북미회담에서 트럼프를 쏴죽인다면 북미전쟁이 일어날 것이다는 문장을 생각해볼 수 있습니다. 트럼프의 여러 발언들을 기준으로 한다면 이 문장은 상당히 높은 기대치를 가질 수 있다는 것을 생각해볼 수 있습니다.
 기상청의 여러 예측들도 Ramsey's test를 사용하여 해석할 수 있습니다. 앞선 글에서 살펴보았던 가령 '내일은 비가 오더라도 많이 오지는 않겠습니다'는 문장을 뜯어보면, 내일 비가 온다는 것을 받아들였을 때 비슷한 기상상황이었던 날들 중에서 비가 많이 오지 않은 날들이 많고 또 여러 정황들을 보았을 때 그럴 가능성이 높다 이해될 수 있습니다.

1-3. Lewis' triviality result

Lewis's triviality result
임의의 확률함수 Pr에 대해서 Pr(A→B)=Pr(B/A)가 성립할 때 Pr(B/A)=Pr(B)또한 성립한다

 조건문의 신뢰도 혹은 참일 확률을 조건부확률로 이해하는 것은 사용하기 매우 좋아보입니다만 루이스에 의해 이런 이해방식은 논리적 모순을 가지는 것으로 증명되었습니다. Pr(B/A)=Pr(B)라면 조건부확률과 절대적확률의 값이 같아지는 결과를 가지게 됩니다. 그러면 Pr(A&B)/Pr(A)=Pr(B)이므로 Pr(A&B)=Pr(A)Pr(B)인데 확률적으로는 A와 B가 동시에 성립할 수 없을 때만 성립합니다. 집합으로 보면 A가 B의 부분집합이라고 하면 Pr(A&B)=Pr(A)이게 되므로 Pr(A)=Pr(A)Pr(B)가 되므로 B가 무엇이든지간에 Pr(B)=1이 됩니다. 따라서 Pr(B)를 1이 아닌 값으로 잡으면 모순을 낳게 되므로 조건문의 신뢰도를 조건부확률로 이해하는 방식은 불가합니다. 이제 증명해봅시다.

 우선 Pr(B/A)를 PrA(B)로 적읍시다. PrA(B)는 이제 A가 참일 때 B가 참일 확률입니다. 혹은 A가 발생했을 때 B가 발생할 확률입니다. 루이스의 정리를 보기 위해서는 우선 보조정리 하나가 필요합니다.

(lemma) 임의의 확률함수에 대해 Pr(A
→B)=Pr(B/A)가 성립할 때 Pr((AB)/C)=Pr(B/A&C)도 성립한다.

 직관적으로 보면 이 명제는 타당해보입니다. 왜냐면 Pr(A→B/C)는 C가 일어났을 때 A→B가 일어날 확률입니다. 그러나 Pr(A→B)를 Pr(B/A)로 본다면 이는 A가 일어났을 때 B가 일어날 확률입니다. 우리는 이미 C를 가지고 있는데 A도 가정했으므로 결국 Pr(A→B/C)는 C와 A를 가정했을 때 B가 일어날 확률과 같습니다. 이는 Pr(B/A&C)로 적을 수 있습니다. 이제 증명을 해봅시다.

Pr(A→B/C)
=PrC(A→B)
=PrC(B/A) (가정에 의해)
=PrC(B&A)/PrC(A)  (조건부확률의 정의에 의해)
=Pr(B&A/C) / Pr(A/C)   (PrC의 정의에 의해)
=Pr(B&A&C)/Pr(C)  / Pr(A&C)/Pr(C)
=Pr(B&A&C)/Pr(A&C)   (Pr(C)약분)
=Pr(B/A&C)    ( 조건부확률함수의 정의)

이 보조정리를 가지고 드디어 lewis triviality result를 증명할 수 있습니다.

Lewis's triviality result
임의의 확률함수 Pr에 대해서 Pr(A→B)=Pr(B/A)가 성립할 때 Pr(B/A)=Pr(B)또한 성립한다

Pr(A→B)
=Pr(B& (A→B))+Pr(~B&(A→B))      ( A→B는(B& (A→B)) v (~B&(A→B))와 동치 )
=Pr(A→B/B)Pr(B)+Pr(A→B/~B)Pr(~B)     (조건부확률의 정의에 의해)
=Pr(B/A&B)Pr(B)+Pr(B/A&~B)Pr(~B)      (보조정리에 의해)
=1x Pr(B)+ 0 x Pr(~B)
=Pr(B)

 마지막에서 둘째 문장은 다음과 같이 증명됩니다.
Pr(B/A&B)=Pr(B&A&B)/Pr(A&B)이고 B&A&B는 A&B와 논리적 동치이므로 분자와 분모가 값이 같아서 1이 됩니다.
Pr(B/A&~B)=Pr(B&A&~B)/Pr(~B)이고 B&A&~B는 논리적 모순이므로 확률값이 항상 0입니다.

 따라서 stalnaker's hypothesis는 성립할 수가 없습니다. 흥미롭게도 Ramsey's test에 대한 해석은 stalnaker's hypothesis만 있는 것은 아닙니다. 이에 대해서는 다음 시간에 살펴보도록 하겠습니다.

Posted by 괴델
,