斯坦福大學(xué)課程推薦:統(tǒng)計(jì)學(xué)習(xí)

閱讀:27965 來源:轉(zhuǎn)載
分享: 
斯坦福大學(xué)的統(tǒng)計(jì)學(xué)John A Overdeck 教席教授。 Hastie 廣為人知的是在應(yīng)用統(tǒng)計(jì)的研究,尤其是在數(shù)據(jù)挖掘、生物信息學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域。

關(guān)于本課程

這是監(jiān)督學(xué)習(xí)的介紹性課程,關(guān)注于回歸分析和分類法。教學(xué)大綱包括:線性和多元回歸,邏輯回歸和線性判別分析;交叉驗(yàn)證和引導(dǎo)程序,模型選擇和正則化方法(嶺回歸和 lasso 回歸);非線性模型,樣條函數(shù)和廣義相加模型;基于樹的方法,隨機(jī)森林和梯度提升;支持向量機(jī)。一些非監(jiān)督式學(xué)習(xí)方法也在談?wù)摲秶校褐鞒煞址治龊途垲惙治? k- 均值和分層回歸)。

這不是數(shù)學(xué)任務(wù)繁重的課程,所以,我們?cè)囍诓贿^度依賴公式和復(fù)雜數(shù)學(xué)運(yùn)算情況下,講解方法。我們關(guān)注的是現(xiàn)代數(shù)據(jù)分析中,我們認(rèn)為重要組成部分。計(jì)算用 R 軟件完成。有專注 R 的課程,從頭給出指導(dǎo),并有更加詳細(xì)章節(jié)講述如何實(shí)踐每章中的技術(shù)。

課程包括了James, Witten, Hastie 和 Tibshirani 所著的《An Introduction to Statistical Learning,with Application in R》(Springer 出版社,2013)所有材料。這本書的 pdf 在圖書網(wǎng)站上可以免費(fèi)獲得。

預(yù)修科目

統(tǒng)計(jì)學(xué)、線性代數(shù)和計(jì)算機(jī)技術(shù)

課程教師

Trevor Hastie:斯坦福大學(xué)的統(tǒng)計(jì)學(xué)John A Overdeck 教席教授。 Hastie 廣為人知的是在應(yīng)用統(tǒng)計(jì)的研究,尤其是在數(shù)據(jù)挖掘、生物信息學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域。他已經(jīng)出版了有關(guān)這些領(lǐng)域的四本書,以及 180 篇多研究文獻(xiàn)。在 1994 年加入斯坦福大學(xué)之前, Hastie 在美國貝爾實(shí)驗(yàn)室工作了 9 年,在此他協(xié)助開發(fā)了在 R 計(jì)算系統(tǒng)很受歡迎的統(tǒng)計(jì)建模環(huán)境。 1976 年,從南非羅德斯大學(xué)獲得統(tǒng)計(jì)學(xué)學(xué)士學(xué)位,1979 年,南非開普敦大學(xué)獲得碩士學(xué)位,1984 年,斯坦福大學(xué)獲得博士學(xué)位。 Hastie 教授是美國數(shù)理統(tǒng)計(jì)學(xué)會(huì)、美國統(tǒng)計(jì)協(xié)會(huì)、國際統(tǒng)計(jì)學(xué)會(huì)、南非統(tǒng)計(jì)協(xié)會(huì)和英國皇家統(tǒng)計(jì)學(xué)會(huì)會(huì)員。獲得許多獎(jiǎng)項(xiàng)和榮譽(yù),包括 1994 年來自哈佛的 Myrto Lefkopolous 獎(jiǎng), 2014 年的 Parzen 創(chuàng)新獎(jiǎng)和 2015 年南非羅德斯大學(xué)的校友獎(jiǎng)。

Robert Tibshirani:斯坦福大學(xué)健康研究、政策和統(tǒng)計(jì)學(xué)院系的教授。他為分析復(fù)雜數(shù)據(jù)集做出了重大貢獻(xiàn),最近又在基因組學(xué)和蛋白質(zhì)組學(xué)上有所貢獻(xiàn)。他最著名的貢獻(xiàn)是 Lasso 回歸,也就是在回歸分析和相關(guān)問題中使用 L1 penalization 。他合作發(fā)表了 200 多篇論文和三本書。 Tibshirani 教授作為合作者發(fā)表第一篇將手機(jī)的使用與交通事故聯(lián)系起來的研究,得到廣泛引用,并在影響了開車時(shí)限制使用手機(jī)的立法。在整個(gè)數(shù)學(xué)科學(xué)領(lǐng)域,他是最被廣泛引用的作者之一。 Tibshirani 教授是美國統(tǒng)計(jì)協(xié)會(huì)、數(shù)理統(tǒng)計(jì)研究院和加拿大皇家學(xué)會(huì)成員。 1996 年,獲得頗有聲譽(yù)的 COPSS 主席獎(jiǎng), 1997年 獲NSERC Steacie 獎(jiǎng),并且在 2012 年入選美國國家科學(xué)院。

課程制作團(tuán)隊(duì)

Will Fithian 和Sam Gross 制作和安排測驗(yàn)問題和復(fù)習(xí)題。 Daniela Witten 幫助提出第 5 章的一些材料。 Wes Choy 管理視頻制作。 Greg Maximov 拍攝和編輯大部分課程視頻以及采訪錄音。 Greg Bruhns, Monica Diaz and Marc Sanders 協(xié)助 Open edX 。

常見問題解答

問:我需要購買一本教材嗎?

答:不,有免費(fèi)的網(wǎng)絡(luò)版本的《An Introduction to Statistical Learning,with Application in R》(Springer 出版社,2013)。 Springer 已經(jīng)同意免費(fèi)試用,所以不需要擔(dān)心版權(quán)問題。當(dāng)然,你不能傳播這個(gè) pdf 文件的打印版。

問:R 軟件和 RStudio 可以免費(fèi)使用嗎?

答:可以。你可以從 http://cran.us.r-project.org/ 免費(fèi)得到 R 軟件。它的安裝往往需要單擊。你可以從 http://www.rstudio.com/ 得到 RStudio ,也是免費(fèi)的,以類似的簡單方式安裝。

問:每周需要花多少小時(shí)的功夫?

答:我們期望每周用大約 3 至 5 小時(shí)去認(rèn)真學(xué)習(xí)材料和做練習(xí)。

問:會(huì)有結(jié)業(yè)證明嗎?

答:有,只要你完成了課程, 在測試中,取得了50% 的合格分?jǐn)?shù)。如果你取得了 90% 的合格分?jǐn)?shù)或更高,你的結(jié)業(yè)證明將是「成績優(yōu)異」。

標(biāo)簽: 大學(xué) 51offer編輯:usaedit1