Please enable JavaScript.
Coggle requires JavaScript to display documents.
틀리지 않는 법 - 수학적 사고의 힘 (조던 엘렌버그) (수학적 지식이 아닌 사고방식 (이성적으로 사고하는 방식) (세상 모든…
틀리지 않는 법 - 수학적 사고의 힘
(조던 엘렌버그)
수학적 지식이 아닌
사고방식
(이성적으로 사고하는 방식)
구체적인 공식이나 계산법 보다는 일반적인 원칙을 이해하는 편이 응용범위가 넓다
세상 모든 문제에 수학이 포함되어 있다.
이미 우리 주변 모든것에 수학이 침투해 있으므로 수학적 사고방식을 장착해야
세상에서 넘치는 정보에서 오류는 찾아내고 거짓해석에 속지 않을 수 있다.
수학은 다른 수단을 동원한 상식의 연장
수학자들은 상식들에 대해 이름 붙이기를 좋아하고 상징을 쓰는 것을 좋아한다. 그러한 수학 언어는 복잡한 개념을 정확하고 신속하게 전달해주기 위한 도구이나 보통 사람들에게 언어가 낯설기 때문에 동떨어진 세상의 얘기라 생각할 수 있다.
수학은 판사가 아니라 탐정이며,
우리가 알 수 없는 것을 알게 해주는 마법사가 아니라
우리가 어느 정도 모르는지 정확하게 가늠해주도록 돕는 도구
수학은 우리가 틀리지 않도록 도와주는 과학이고 그 기법과 관습들은 수백 년에 걸친 고된 노력과 논쟁을 통해서 밝혀진 것이다.
그러한 :star:
수학적 도구
들을 손에 쥐고 있으며 세상을 더 깊게, 더 올바르게, 더 의미있게 이해할 수 있어
수학적도구
기대
기대값(평균값)
(확률1
보상1)+(확률2
보상2)+....
에드먼드 핼리가 과거 연금가격 계산법에 적용됨
기대값은 우리가 기대하는 값이 아니다.
예시) 복권의 기대값 → 회차 →기대값증대 (대수학을 적용 적정 보상금 도출)
동시에 당첨될 확률 계산(35%) ← 많은 경우의 수
최대한 남들이 고르지 않을 것 같은 수 선택(극단값)
MIT학생의 복권(캐시윈폴)의 이야기
큰수의 법칙 적용(1000장 구매) 기대값에 도달할 확률 상승시켜줌
가산성 적용됨 (어떤 두 가지를 합한 기대값은 첫 번째 것의 기대값과 두 번째 것의 기대값을 합한 것과 같다)
가산성의 예시) 뷔퐁의 바늘 문제 p.285
볼테르도 비슷한 방법으로 이와 같은 방법으로 부를 축적함
진정한 가치를 확실히 알 수 없는 대상에 대해서 올바른 값을 매기도록 도와주는 방법
효용이론
표준경제학 : 인간이 합리적으로 행동할 때 효용을 극대화 하는 결정을 내린다고 가정함
1982년 노벨 경제학상 수상자 조지 스티글러 "비행기를 놓친 적이 한번도 없다면 당신은 공항에서 너무 많은 시간을 쓰는 것이다"
삶의 모든 것에는 효용이 있다.
발생확률에 주관적 기대값 부여
레퍼곡선 형태
효용의 극대화값으로 판단
예시) 정부의 복지 운영도 효용이론을 따르기 때문에 부당 수혜자가 나타날 수 있는 것은 당연 (낭비를 없애는 것도 비용임)
기대효용의 원칙
기대효용이 모든 것을 알진 못한다.
WHY?
불확실성(알려지지 않은 미지) → 수치적 분석 불가
1 more item...
위험(알려진 미지) → 수치적 분석이 가능
1 more item...
수학이 다른 수단을 통원한 상식의 연장임을 알려줌
보편적인 효용곡선은 없다
서로 다른 환경에 놓인 서러 다른 사람들은 같은 돈에 서로 다른 효용을 매긴다
한계 효용의 원리
분산
백만 달러를 잃으면 개인의 문제지만 50억 달러를 잃으면 정부의 문제다
결정의 가능한 결과들이 얼마나 넓게 퍼져 있는지, 양극단의 결과가 발생할 가능성이 얼마나 되는지 측정하는 척도이다.
대분분의 사람들은, 특히 유동자산이 무한하지 않은 사람들은 기대값이 똑같은 내기들 중에서 분산이 낮은 내기를 선호한다.
장기적으로는 주식의 수익률이 높다는 것을 알면서도 지방채에 투자하는 이유
분산을 낮추기 위한 방법
랜덤전략
1 more item...
평면기하학
2 more items...
복권
효용이 낮을 경제활동
인기가 많음
WHY
부정적 효용을 0에 두기 때문
1 more item...
사람들의 효용곡선이 규정한 경로와 다르다
1 more item...
재미있는 일이라고 규정
1 more item...
사업도 동일하다
성공할 가능성 보다 실패할 가능성이 높음
기업가정신의 속성
작은 확률의 큰 돈을 벌 확률
중간 확률로 그럭저럭 생계를 이어갈 확률
상당히 높은 확률로 실패할 확률
2 more items...
회귀
평균으로의 회귀
호러스 시크리스트 "1930년대 미국 기업들 조사 결과 기업활동이 평균으로 회귀됨"
경쟁의 압박과 운영면에서 통제가 미치는 데이터에서는 평균으로 회귀한다 주장
해럴드 호텔링의 반박
안정된 요인과 우연의 영향을 둘 다 받는 변수의 조사에서는 평범으로 회귀는 당연한 현상
1 more item...
골턴
의 부모의 키와 자녀의 키에 대한 발견
평범함을 사랑하는 어떤 신비로운 힘이 있는 것이 아니라 유전과 운이 뒤섞여서 작동하는 방식이 그럴 뿐인것이다.
예술적인 성공도 재능과 운의 결합이고 따라서 평균으로 회귀가 적용될 것이다.
우리가 연구하는 현상이 우연의 영향을 받을 때면 언제든 평균으로 회귀가 작동한다는 것을 보여줌
산포도
비슷한 값을 가지는 값끼리 연결된 선 = 등치곡선
타원형태의 이심률
이심률이 크다 유전성이 강력하고 평균으로의 회귀가 미약
1 more item...
이심률이 작다 평균으로의 회귀가 압도한다
1 more item...
행성의 타원운동, 원뿔을 자르면 나오는 표면
1 more item...
번외) 골턴과 우생학
수학은 틀리지 않도록 해주는 방법이지만 모든 것에 대해서 틀리지 않도록 해주는 것은 아니다
수학적 분석 능력을 키움으로써 자신의 신념을 확신하게 되었을때 그 믿음이 틀리는 일에까지 부당하게 확장되어서는 않된다
상관관계가 인과관계는 아니다
백터
두변수의 상관관계는 두 벡터 사이의 각도로 결정된다
예각 : 양의 상관관계
둔각 : 음의 상관관계
직각 : 상관관계가 0 (상관관계가 없다 = 직교한다)
상관관계가 없다고 해서 연관성이 없는건 아니다.
수학적 도구는 특정 종류의 현상은 감지하지만 다른종류는 감지하지 못한다. (사진기가 감마선은 확인하지 못하는 것처럼)
어떤 현상이 상관관계가 없다고 밝혀졌다 하더라도 이 점을 염두해야 한다.둘 사이 아무관계가 없다는 것은 아니다.
상관계수가 감지할 수 있는 종류의 관계가 없다는 말이다.
상관관계가 있다고 하면
상관성에 대해 통계적 검정 필요
상관관계를 가정법으로 바뀌어 인과관계를 암시해서 통계적으로 증명
존재
합리적인 개인들의 집단 행동에서 비합리적으로 보이는 여론이 생겨날 수 있다
투표
다수결
두 선택지 사이에서 결정할 때만 최선의 기법이다.
선택지가 툴을 넘어서면 다수결의 선호에 모순이 스미기 시작한다
1 more item...
해석에 따라 상이하고 최대값을 어떻게 고려하느냐에 따라 달라진다.
예시) 장애인 범죄자 처형 여론조사
보르다식 계산
2 more items...
수학적 [무관한 대안들의 독립성]
선택지 A와 B가 있을 때, 선택지 C에 의해 A,B 선호도 문제에 영향을 미쳐서는 안된다.
투표에서는 독립성이 존재하지 않음
1 more item...
콩도르세
"다수결의 확률에 의한 분석" [배심원의 정리]
배심원 각각이 아무리 조금이라도 옳은 선택을 할 편향이 있으면 배심원단의 규모가 충분히 크면 결국은 옳은 결론에 도달할 가능성이 높다 (배심원들의 판단의 독립적이라는 가정하에)
1 more item...
공리 = 투표자의 과반수가 B보다 A를 좋아한다면 B는 대중의 선택이 될 수 없다
우리는 무엇이 진실인지를 알아내려고 하는가?
아니면, 우릐의 규칙과 절차가 승인하는 결론이 무엇인지를 알아내려고
(실험과학 분야) R.A 피셔 vs 네이만-피어슨
유죄를 선고받은 무고한자
무죄를 선고받은 범죄자
연방 대법관 존 로버츠
"판사들은 법의 하인입니다. 법이 판사들의 하인인게 아닙니다.
판사는 심판과 같습니다. 심판은 규칙을 만들진 않지요. 규칙을 적용할 뿐입니다.
심판과 판사의 역활은 중요합니다. 그들은 모든 사람들이 규칙에 따라 경기하도록 감독합니다.
그러나, 그들의 역활은 제한적입니다. 누구도 야구 경기에 심판을 보러 가진 않습니다."
수학은 때로 명백히 옳았던 것이 절대로 틀린 것임을 보여주는 짜증나는 버릇을 갖고 있다.
공리가 진리가 될 수는 없는 법
피타고라스 정리 이전의 시대에서는 모든 기하하적 크기가 두정수의 비여야 한다는 것이 명백한 사실이었다.
유클리드 기하학 다섯가지 공리 중 마지막은 "구"를 설명할 수 없음을 증명
천재성
천재성의 역설
노력(기개)을 중요성을 간과하기 쉽다.
WHY
1 more item...
추론
확률이 낮은 사건에 접했을 때 놀란것은 당신의 실수다
세상은 방대하기 때문에 확률이 낮은 사건은 많이 일어난다.
우연의 일치란 대개 적당히 거리를 두고 바라보면 놀라움이 사라지는 법이다.
아리스토텔레스 "일어나기 힘든 일은 일어날 가능성이 있다. 그 점을 이해한다면 일어나기 힘든 일은 반드시 일어난다고도 말할 수 있다."
추론은 어렵다
추론은 역분석이다.
대수학이 어려운 것과 마찬가지
2차 방정식의 근은?
3차 방정식의 근은?
고려 대상이 되는 이론들의 범위를 전체적으로 세심하게 따져야 한다.
이차방정식의 해가 하나 이상인것 처럼 똑같은 관찰을 낳는 이론이 하나가 아니라 여러 개일지 모른다.
그것들을 고려하지 않는다면 우리의 추론은 심하게 빗나갈 수 있다.
베이즈 추론
빅데이터 시대의 위협
우리는 오싹한 초능력을 지닌 알고리즘을 걱정할 시간을 줄여서
그 대신 허접한 알고리즘을 더 많이 걱정해야 할지도 모른다
카오스 이론
에서 에드워드 로런츠는 데이터를 아무리 모아도 날씨 예측 한계는 2주로 생각했다.
사람의 행동도 맥락에 따라 달라질 수 있기 때문에 정확한 예측을 한다는 것은 어려울 것이다.
알고리즘에 의한 예측의 시대
기업의 예측목표는 정확함이 아니라 경쟁보다 조금더 잘 맞으면 되는 것이다. (10% 더)
사전확률(증거를 보기 전에 품은 믿음)에서 사후확률(증거를 본 뒤의 믿음)로 넘어가는 과정이 확률 이론에서 베이즈 정리라는 오래된 공식에 의존 (로지스틱 회귀분석?)
증거를 본 뒤에 무언가를 얼마나 믿게 되었는냐 하는 것은 증거가 제공하는 정보에만 달린게 아니라
당신이 애초에 그 무언가를 얼마나 믿었느냐에도 달려 있다.
우리의 사전확률은 평평하지 않고 뽀족뽀족하다
선형성
순간의 착각이라도 사람들은 왜 비선형성(곡선)을 직선으로 생각할까?
레퍼곡선 (세율과 정부 세입과의 관계)
중요한 사실은 내가(우리가) 어디에 위치하는 냐? 인 것이다.
원주률 <- 피타고라스 정리
곡선도 국소적으로 직선이다
제논의 역설
수학적으로는 맞다
1 more item...
미적분
선형회귀(=테이블톱)
사회과학에서 거의 틀림없이 쓰게되는 도구 중 하나
장점 : 다용도, 쉽게 사용
단점 : 무작정의 선형회귀 판단
자신의 하는 작업에 세심한 주의를 기울리지 않고서
무작정 도구를 사용하면 결과가 참혹할 수 있다.
예시) 비만 예측 2048년에는 100% 다 비만이다.?
부분의 선형회귀와 그 합의 선형회귀가 논리적으로 부합하지 않는다면 선형회귀를 통한 예측은 틀렸다고 할 수 있겠다.
선형회귀는 엔지니어링적 판단이 많이 반영되어야 함
수학의 위생법칙 = 어떤 수학기법을 현장에 적용하여 시험할 때는 같은 계산을 다른 방식으로 여러 차례 반복하라.
그때마다 다른 답이 나온다면 기법에 뭔가 문제가 있는 것이다.
또는 중심극한의 정리 = 표본의 크기가 클수록 비율의 변이가 작아진다.
전형적인 차이값은 횟수의 제곱근에 좌우된다 (드 무아브르)
이미 벌어진 일에 대해서 균형을 맞추는 것이 아니라, 비율로 따져서 과거의 횟수가 무시해도 좋을 만큼 작아질때까지 새로운 데이터를 더함으로써 이미 벌어진 일을 희석한다.
비율은 우리를 오도할 수 있다.
수가 음수가 될 수 있는 상황에서는 퍼센트를 논하지 말라
사실 계산기는 우리가 무슨 계산을 하고 싶은지를 따진 뒤에야 비로소 동원되는 것이다.
한 수를 다른 한 수로 나누는 것은 연산이다. 무엇을 무엇으로 나눠야할지 알아내는 것이야 말로 진정한 수학이다.
예시) 아브라함 발드와 사라진 총알 구멍
2차 세계대전 당시 돌아온 비행기 동체 갑옷 강화의 위치
문제를 좀 더 깔끔하게 만들어 주는 수학자의 오래된 트릭 = 어떤 변수를 0 으로 맞쳐보는 것
어떤 가정은 품고 있는가? 그 가정은 정당한가?
어떻게 하면 옳을 수 있는가?
중요한 비평가
확신하지 않는 것은 나약한 인간의 태도가 아니라, 강인한 인간의 태도이다. -> 심이적인 이상의 수준에 오른 일종의 형세 관망이다.
수학은
사람들은 보통 확실성과 절대적인 진리의 영역으로 여긴다.
그러나, 불확실한 것에 대해서 추론하게끔 해주는 수단, 불확실성을 완전히 길들이진 못해도 어느 정도 다스리게끔 해주는 수단이다.
원칙적인 방식에 따라 확신하지 않는 방법을 알려준다.
(나는 확신하지 않고, 확신하지 않는 이유는 이것이며, 확신하지 않는 정도는 대충 이정도 수준입니다.)
예시) 네이트 실버
온라인 포커선수였다가 야구 통계 전문가가 되었다가 정치 분석가로 변신함
오바바 대통령 선거당시 누가 이길지 말하는 대신 가능성이 어느 정도라고 생각하는지를 말했다.
(확률분포로 말했다. 실제 주별 당선예측은 다 맞았다.)
실버는 불확실했다. 사람들 앞에서 그리고 사람들은 그것을 소화했다. 이 확신하지 않는 것 이것은 행동이다!
수많은 시행착오를 겪으면서도 행동하려 나서는 사람이 위대하다고 하지만,
그전에 수학적 사고를 통한 불확실성에 대해 파악하고 행동하는 것이 실패의 횟수를 줄이고,
더 나아가 원하지 않는 방향임을 깨닫게 해주는 것이라 생각한다.
바이블코드
볼티모어 주식 중개인
무츄얼펀트 인큐베이션
여지의 힘
확률이 낮은 사건에서 믿음직한 추론을 내려할때는 여지가 적이 된다.
통계적 검정을 거쳤다면?
예시) 죽은 연어의 fMRI = 잡음(노이즈)
방대한 데이터 집합을 수월하게 얻을 수 있는 시대에는 우리가 그 결과를 평가하는데 쓰는 표준기법,
즉 어느 지점을 기준으로 진정한 현상과 무작위적 변동을 가를 것인가 하는 방법론에 위험한 압력이 가해지고 있음을 경고함
통계적 안정장치 필요
다중 비교 수정
아브라함 발드가 지적했듯이, 상황을 제대로 보려면 돌아오지 못한 비행기들도 함계 고려해야 한다
2012년 캘리포니아 생물공학 회사 '암젠' 과학자들이
암 생물학에서 유명한 53개 실험을 재현평가 결과 똑같이 재현된것은 6개 뿐이였다.
신뢰구간
개발자 = 예지 네이만 (폴란드 사람), 이건 피어슨과 공동연구 (아버지가 칼 피어슨)
통계는 질문에 답하는 학문이 아니라, 결정을 내리는 학문
법정과 유사(법정의 목적은 진실이 아니라 정의다)하며 유의성 검정은 판사가 아니라 탐정이다.
귀류법(모순에 의한 증명)
귀무가설의 유의성 검정(낮은 가능성에 의한 증명)
현대 통계학의 창시자 R.A 피셔가 개발
유의성 검정을 형식적 활동으로 만든것이 업적임
실험을 한다.
귀무가설이 참이라고 가정하고 그 경우에 관찰결과 처럼 극단적인 결과가 나올 확률을 p라고 하자
p값(p=0.05)이 작으면 결과가 통계적 유의성이 있다고 말해도 좋다.
유의성 검정은 일종의 과학적 도구이므로 여느 도구 처럼 일정 수준의 정확도를 가진다.
검정력이 높은 연구는 실제로는 중요하지 않은 사소한 효과에 대해 걱정하게끔 만들 수 있는 데 비해, 검정력이 낮은 연구는 기법이 취약해서 보지 못하는 것 뿐인 미세한 효과를 기각하게끔 만든다.
우리가 무언가를 감지했다고 해서 그것이 늘 중요한 것은 아니다.
농구에서 핫핸드는 없다.
귀무가설을 기각한다는 것은 0라는 의미가 아니다. 무척 미미(확률이 낮다)할 수 있다는 것이다.
P해킹
확률이 대단히 낮다는 것
무언가가 불가능하다는 것
전혀 같지가 않다.
불가능한 일은 절대 벌어지지 않지만 확률이 낮은 일은 많이 벌어진다
피셔 "시기와 상황을 불문하고 늘 고정된 유의성 수준으로 가설을 기각하는 과학자란 존재하지 않는다. 과학자는 자신의 증거와 개념에 비추어 개별 사례마다 마음을 정한다
가설 H가 참이라고 가정하자
H가 참이라면 F는 사실일 수 없다는 결론이 나온다
하지만 F는 사실이다
따라서 H는 거짓이다
예시) 2012년 총격사건에서 사상자가 200명이다. 살인사건은 88건이였다
사상자가 200명이라는 것은 거짓이다.