- 美國(guó)大學(xué)畢業(yè)典禮進(jìn)行時(shí),你知道學(xué)位服顏色還有講究嗎?
- 英美德法留學(xué)生經(jīng)常被問(wèn)的問(wèn)題 沒(méi)事看看好歡樂(lè)
- 李冰冰躲在廁所背單詞:開(kāi)掛的人生,不只把欲望寫(xiě)在臉上
- 出國(guó)留學(xué)不一定有高回報(bào),但一定許你不一樣的人生
- 《華爾街日?qǐng)?bào)》: 名校出身與未來(lái)收入到底有多大關(guān)系?
- 紐約時(shí)報(bào):多年以前的亞裔學(xué)霸們,畢業(yè)以后都過(guò)得如何?
- 我為什么選擇30歲以后去留學(xué)?當(dāng)你放棄努力,才真正老了!
- 100位海歸爆回國(guó)后真實(shí)薪資!內(nèi)情竟然如此......
“When I was at Cornell, I was rather fascinated by the student body, which seems to me was a dilute mixture of some sensible people in a big mass of dumb people” (“當(dāng)我在康奈爾大學(xué)的時(shí)候,我覺(jué)得學(xué)生群體很有意思。他們仿佛是一些靠譜的人被稀釋在人數(shù)巨大的傻缺群中。”)
我有幸也曾經(jīng)求學(xué)于美國(guó)西岸一所名校。在那里讀書(shū)的日子里,有些遭遇也讓我不禁疑惑:我靠,似乎什么人都能進(jìn)這所聞名世界的學(xué)府呀。后來(lái)用數(shù)學(xué)推算一下,倒也不奇怪了。
“名校傻X” (原題用詞如此)這個(gè)現(xiàn)象,可以用統(tǒng)計(jì)學(xué)中的 type I & type II error 來(lái)解釋。這個(gè)概念又可以被稱作假陽(yáng)性(false positive)、假陰性(false negative)。簡(jiǎn)單來(lái)說(shuō),就是誤把正的判斷成反的,和誤把反的判斷成正的這兩種錯(cuò)誤。
這兩種誤判往往有著內(nèi)在,不可調(diào)和的對(duì)立。當(dāng)你試圖減低其中一種誤判的時(shí)候,往往不可避免要增加另一種誤判的概率。比如,如果你把每一個(gè)嫌疑犯都判為有罪的話,你就不會(huì)漏掉真兇,但是你也很可能錯(cuò)殺不少無(wú)辜。反之你如果假設(shè)所有人都無(wú)罪的話,固然不會(huì)冤枉好人,但是也放過(guò)不少罪犯。
回到名校里不靠譜同學(xué)這個(gè)話題(原問(wèn)題中的傻X一詞還是過(guò)于重口味哈)。我們假設(shè)那些申請(qǐng)名校的人,或者說(shuō)社會(huì)上,不靠譜的人本來(lái)就很多,比如95%的人都是不靠譜的。而名校的錄取過(guò)程是為了盡量篩除這些不靠譜的人,留下那5% 靠譜的同學(xué)。但是名校的申請(qǐng)過(guò)程肯定是不完美的,比如會(huì)有以下情況:
靠譜同學(xué)被錄取的概率:80%
不靠譜卻被錄取(admissions mistake)的概率:10%
靠譜同學(xué)的錄取率是不靠譜同學(xué)錄取率的8倍之多,按說(shuō)這已經(jīng)是一個(gè)不錯(cuò)的錄取流程了。但是我們來(lái)看看結(jié)果。假設(shè)有1000人申請(qǐng)。根據(jù)剛才的假設(shè),其中
1000 * 95% = 950 人是不靠譜的。
其中被錄取的 950 * 10% = 95 人
而靠譜的同學(xué)數(shù):
1000 * 5% = 50 人
其中被錄取的:50 * 80% = 40 人
最后錄取總?cè)藬?shù):
95 + 40 = 135 人
其中不靠譜的人數(shù)占比:95 / 135 = 70%
而這是一個(gè)總錄取比例僅有 13.5% (差不多是 Cornell 的水平),并且能夠相當(dāng)準(zhǔn)確甄別靠譜與不靠譜申請(qǐng)者的學(xué)校。
所以,名校中也有大量不靠譜的人存在,只是濃度比社會(huì)均值低了一些而已。
其根本原因是名校再仔細(xì)的刪選機(jī)制,也架不住潮水般的龐大的社會(huì)上的傻缺群體。雖然盡可能降低誤判概率,但是那些漏網(wǎng)的傻缺也足以讓名校中的靠譜同學(xué)稀釋在茫茫的傻缺海洋中了。這也導(dǎo)致了回答開(kāi)頭所引用的費(fèi)曼先生那句話。
另外,多學(xué)習(xí)基本的數(shù)學(xué)和統(tǒng)計(jì)學(xué)常識(shí),受益終身。
大家可以設(shè)想另一個(gè)(非常真實(shí)的)例子。假設(shè)有一種罕見(jiàn)的絕癥可以通過(guò)體檢檢查出來(lái)。正常人群中,這個(gè)絕癥的發(fā)病率是 0.1%。如果你身懷該絕癥,被查出的概率是 99.9%;如果你是健康的,卻被誤判成患有該絕癥的概率是 0.1%(這也就是剛才說(shuō)的 false positive)。按說(shuō)這個(gè)檢查已經(jīng)是非常準(zhǔn)確了。
假設(shè)你是一個(gè)普通人,體檢中發(fā)現(xiàn)是陽(yáng)性。你其實(shí)健康的概率是多少?
這里我就不具體推算了。計(jì)算方法跟剛才的 “名校傻缺” 同。結(jié)果是 50%。這不能算什么好消息,但至少還不是一個(gè)已經(jīng)絕望的地步。在你決定把你的余生盡情揮霍和享樂(lè)之前,你至少應(yīng)該再去測(cè)試一次。
不過(guò)這 50% 前提是 "你是一個(gè)普通人“。如果你是屬于該疾病的高危人群,那么就不是這個(gè)結(jié)果了。這就涉及到 Bayesian statistics 中所說(shuō)的 prior。而我們的整個(gè)推算也是遵循了 Bayesian statistics 的思維。這一切都沒(méi)什么難的(樓下一位留言說(shuō)是初中生可以理解的。我同意)。
但是據(jù)說(shuō)美國(guó)曾經(jīng)把上面這道有關(guān)假陽(yáng)性的題考了考醫(yī)生,大多數(shù)不能夠正確解答。這說(shuō)明了基本的數(shù)學(xué)和統(tǒng)計(jì)學(xué)知識(shí)是多么的欠缺,哪怕在受過(guò)高度教育的人中。
不要成為這樣一個(gè)人。學(xué)好數(shù)學(xué)和統(tǒng)計(jì)學(xué)。
這可能在你人生的某個(gè)時(shí)刻,讓你做出關(guān)乎生死存亡的正確決定。