Notice
Recent Posts
Recent Comments
Link
«   2024/10   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31
Archives
Today
Total
관리 메뉴

에코프로.AI

[관련도서] 원인과 결과의 경제학 본문

AI Miscellany

[관련도서] 원인과 결과의 경제학

AI_HitchHiker 2024. 5. 21. 11:10

 

  • 당신이알고 있는 사실은 진실인가?
     - 많은 사람들이 '인과관계'와 '상관관계'를 혼동하는 경우가 많다.
     - '두 개의 사실 중 한쪽이 원인이고 다른 한쪽이 결과' 인 상태를 '인과관계가 있다' 고 한다.
    즉 체력이 좋다는 '원인'에 의해 성적이 높다는 '결과'가 발생했다면, 이 관계는 인과관계라고 할 수 있다.
    한편, '두 사실이 서로 관계는 있지만, 원인과 결과의 관계에 있지 않은 것' 을 '상관간계가 있다'고 한다.
    만일 두 사실의 관계가 상관관계라면, '언뜻 원인처럼 보이는 것'이 다시 발생해도 기대하는 '결과'는 얻을수 없다.
    - 인과관계와 상관관계를 정확하게 구분하는 것은 매우 중요한 문제다. '체력이 좋기 때문에 성적이 높다'는 말은 '체력이 좋아지면 전혀 공부하지 않아도 성적을 높일 수 있다'는 이야기가 된다. 이는 논리가 성립되지 않으므로 체력과 학력의 관계는 길러주어도 성적은 오르지 않는다. 이 교훈은 매우 중요하다. 
    인과관계와 상관관계를 혼동하면 잘못된 판단을 내리는 우를 범할 수 있기 때문인다.
  • 돈과 시간을 정확히 인과관계에 근거한 곳에 쓰면 좋은 결과를 얻을 확률이 그만큼 높아진다.

  • 인과관계인지 상관관계인지 정확히 구분해내기 위한 방법론을 '인과추론'이라고 한다. '인과'란 말 그대로, '원인과 결과'를 뜻하며, '추론'이란 '있는 사실을 토대로 판단을 이끌어 내는 것, 추리와 추정을 통해 결론을 이끌어 내는 것'을 의미한다. 즉, 두 개의 사실이 각각 원인과 결과인지 평가해 결론을 이끌어내는 것이다.

  • '빅데이터'가 유행어처럼 된 지금 누구나 간단히 데이터를 분석할 수 있게 됐다. 그러나 이는 분석 결과를 정확하게 해석할 수 있게 됐다는 의미가 아니다. 
    '빅데이터 시대에는 데이터 분석 기술 뿐 아니라, 데이터의 분석 결과를 해석하는 기술도 필요하다.'

  • 19세기를 대표하는 미국의 사상가이자 작가인 랠프 윌도 에머슨은 "얄팍한 사람은 운을 믿는다. 강한 사람은 원인과 결과를 믿는다"고 말했다. '인과 추론'은 결국 데이터가 벌람하는 시대의 필수 교양이라고 할 수 있을 것이다.

  • 두 변수의 관계가 인과관계인지 아니면 상관관계인지를 확인하기 위해서는 다름의 3가지를 의심해봐야 한다.
    1. '우연의 일치'는 아닌가?
    2. '제3의 변수'는 없는가?
    3. '역의 인과관계'는 존재하지 않는가?
      - 역의 인과관계 : 원인이라고 오해했던 부분이 결과이고, 결과라고 생각했던 것이 원인인 상태

인과추론의 5단계
1단계. '원인'은 무엇인가?
 - 광고와 매출의 경우에는 '광고'가 이에 해당된다. 단. 원인이 광고라 하더라도 그것이 구체적으로 광고료인지, 게재면적인지, 아니면 단순히 광고를 냈는지의 여부인지 등 무엇을 가리키는지는 명확히 정의해야 한다.
2단계. '결과'는 무엇인가?
 - 광고와 매출에서는 '매출'이 이에 해당된다. 확인하고자 하는 것이 매출인지, 영업이익인지 확실히 해야 한다. 즉 결과 또한 애매하게 정의해서는 안된다.
3단계. 세 가지 체크 포인트를 확인 해야 한다.
 - (1)우연의 일치는 아닌가?
   (2)교란 요인은 존재하지 않는가?
   (3) 역의 인과관계는 존재하지 않는가?

 - 광고와 매출의 사례에서는 (2)의 광고와 매출 양쪽 모두에 영향을 미치고 있을 만한 변수가 존재하지 않는지 확실하게 검토해야 한다. 예를 들어, '호황'과 같은 요인이 존재할 가능성이 있을 수 있다. 경기가 좋으면 광고를 내려는 경향이 강해지고 이와 함께 매출도 향상될 가능성이 높다. 만일 '호황'이라는 교란 요인이 존재한다면 광고와 매출의 관계는 거짓 상관에 지나지 않는다.
4단계. 반사실을 만들어 낼 것

 - 광고와 매출 사이에 인과관계가 있는지 확인하기 위해서는 당신의 회사가 광고를 냈을때의 매출과 광고를 내지 않았을 때의 매출을 비교할 필요가 있다. 여기서 '광고를 내지 않았을 때'라는 가정이 바로 '반사실'이다. 예를 들어 경기가 좋으면 '광고를 내지 않았어도 매출은 올랐을 것'으로 예상할 수 있기 때문에, 광고가 매출에 주는 효과는 생각보다 작을 수 있다. '광고를 내지 않았을 때'라는 반사실의 매출은 (타임머신이 있다면 모를까) 알 수 없다. 그러나 광고와 매출의 인과관계를 알기 위해서는 반드시 반사실이 필요하기 때문에 '타당한 값'으로 채워야 한다. 예를 들어 같은 시기에 광고를 내지 않았던 경쟁사 매출 데이터의 활용 가능성 등을 모색해봐야 한다.
5단계. 비교 가능해지도록 조정할 것
 - 반사실을 타당한 값을 채우는 유력한 방법은 '비교 가능'한 그룹이 되도록 조정하는 것이다. 예를 들어 같은 시기에 광고를 내지 않았던 경쟁사가 당신의 회사와 '비교 가능'하다고 치자. 이때 경쟁상의 매출은 '당신의 회사가 만일 광고를 내지 않았을 때(반사실)의 매출'을 타당한 값으로 채우는 데 사용할 수 있다.