成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

重磅 | 完備的 AI 學(xué)習(xí)路線,最詳細的資源整理!

荊兆峰 / 1465人閱讀

摘要:是你學(xué)習(xí)從入門到專家必備的學(xué)習(xí)路線和優(yōu)質(zhì)學(xué)習(xí)資源。的數(shù)學(xué)基礎(chǔ)最主要是高等數(shù)學(xué)線性代數(shù)概率論與數(shù)理統(tǒng)計三門課程,這三門課程是本科必修的。其作為機器學(xué)習(xí)的入門和進階資料非常適合。書籍介紹深度學(xué)習(xí)通常又被稱為花書,深度學(xué)習(xí)領(lǐng)域最經(jīng)典的暢銷書。

【導(dǎo)讀】

本文由知名開源平臺,AI技術(shù)平臺以及領(lǐng)域?qū)<遥篋atawhale,ApacheCN,AI有道和黃海廣博士聯(lián)合整理貢獻,內(nèi)容涵蓋AI入門基礎(chǔ)知識、數(shù)據(jù)分析挖掘、機器學(xué)習(xí)、深度學(xué)習(xí)、強化學(xué)習(xí)、前沿Paper和五大AI理論應(yīng)用領(lǐng)域:自然語言處理,計算機視覺,推薦系統(tǒng),風(fēng)控模型和知識圖譜。是你學(xué)習(xí)AI從入門到專家必備的學(xué)習(xí)路線和優(yōu)質(zhì)學(xué)習(xí)資源。

基礎(chǔ)知識

1 數(shù)學(xué)

數(shù)學(xué)是學(xué)不完的,也沒有幾個人能像博士一樣扎實地學(xué)好數(shù)學(xué)基礎(chǔ),入門人工智能領(lǐng)域,其實只需要掌握必要的基礎(chǔ)知識就好。AI的數(shù)學(xué)基礎(chǔ)最主要是高等數(shù)學(xué)、線性代數(shù)、概率論與數(shù)理統(tǒng)計三門課程,這三門課程是本科必修的。這里整理了一個簡易的數(shù)學(xué)入門文章:

數(shù)學(xué)基礎(chǔ):高等數(shù)學(xué)

https://zhuanlan.zhihu.com/p/...

數(shù)學(xué)基礎(chǔ):線性代數(shù)

https://zhuanlan.zhihu.com/p/...

數(shù)學(xué)基礎(chǔ):概率論與數(shù)理統(tǒng)計

https://zhuanlan.zhihu.com/p/...

機器學(xué)習(xí)的數(shù)學(xué)基礎(chǔ)資料下載:

1) 機器學(xué)習(xí)的數(shù)學(xué)基礎(chǔ).docx

中文版,對高等數(shù)學(xué)、線性代數(shù)、概率論與數(shù)理統(tǒng)計三門課的公式做了總結(jié)。

2) 斯坦福大學(xué)機器學(xué)習(xí)的數(shù)學(xué)基礎(chǔ).pdf

原版英文材料,非常全面,建議英語好的同學(xué)直接學(xué)習(xí)這個材料。

下載鏈接:

https://pan.baidu.com/s/1LaUl... 提取碼: hktx

國外經(jīng)典數(shù)學(xué)教材:

相比國內(nèi)浙大版和同濟版的數(shù)學(xué)教材更加通俗易懂,深入淺出,便于初學(xué)者更好地奠定數(shù)學(xué)基礎(chǔ)。下載鏈接:

https://blog.csdn.net/Datawha...

2 統(tǒng)計學(xué)

入門教材:深入淺出統(tǒng)計學(xué)

進階教材:商務(wù)與經(jīng)濟統(tǒng)計

推薦視頻:可汗學(xué)院統(tǒng)計學(xué)

http://open.163.com/special/K...

3 編程

入門人工智能領(lǐng)域,首推Python這門編程語言。

1) Python安裝:

Python安裝包,我推薦下載Anaconda,Anaconda是一個用于科學(xué)計算的Python發(fā)行版,支持 Linux, Mac, Windows系統(tǒng),提供了包管理與環(huán)境管理的功能,可以很方便地解決多版本Python并存、切換以及各種第三方包安裝問題。

下載地址:

https://www.anaconda.com/down...

推薦選Anaconda (python 3.7版本)

IDE:推薦使用pycharm,社區(qū)版免費

下載地址:https://www.jetbrains.com/

安裝教程:

Anaconda+Jupyter notebook+Pycharm:

https://zhuanlan.zhihu.com/p/...

Ubuntu18.04深度學(xué)習(xí)環(huán)境配置(CUDA9+CUDNN7.4+TensorFlow1.8):

https://zhuanlan.zhihu.com/p/...

2) python入門的資料推薦

a.廖雪峰python學(xué)習(xí)筆記

https://blog.csdn.net/datawha...

b.python入門筆記

作者李金,這個是jupyter notebook文件,把python的主要語法演示了一次,值得推薦。下載鏈接:

https://pan.baidu.com/s/1IPZI... 提取碼: 2bzh

c.南京大學(xué)python視頻教程

這個教程非常值得推薦,python主要語法和常用的庫基本涵蓋了。

查看地址:

https://www.icourse163.org/co...

看完這三個資料后python基本達到入門水平,可以使用scikit-learn等機器學(xué)習(xí)庫來解決機器學(xué)習(xí)的問題了。

3)補充

代碼規(guī)范:

https://zhuanlan.zhihu.com/p/...

numpy練習(xí)題:

https://zhuanlan.zhihu.com/p/...

pandas練習(xí)題:

https://zhuanlan.zhihu.com/p/...

數(shù)據(jù)分析/挖掘

1 數(shù)據(jù)分析的基礎(chǔ)書籍

《利用python進行數(shù)據(jù)分析》

這本書含有大量的實踐案例,你將學(xué)會如何利用各種Python庫(包括NumPy,Pandas、Matplotlib以及IPython等)高效地解決各式各樣的數(shù)據(jù)分析問題。如果把代碼都運行一次,基本上就能解決數(shù)據(jù)分析的大部分問題了。

2 特征工程

https://blog.csdn.net/Datawha...

3 數(shù)據(jù)挖掘項目

https://blog.csdn.net/datawha...

機器學(xué)習(xí)

公開課 吳恩達《Machine Learning》

這絕對是機器學(xué)習(xí)入門的首選課程,沒有之一!即便你沒有扎實的機器學(xué)習(xí)所需的扎實的概率論、線性代數(shù)等數(shù)學(xué)基礎(chǔ),也能輕松上手這門機器學(xué)習(xí)入門課,并體會到機器學(xué)習(xí)的無窮趣味。

課程主頁:

https://www.coursera.org/lear...

中文視頻:

網(wǎng)易云課堂搬運了這門課,并由黃海廣等人翻譯了中文字幕。

中文筆記及作業(yè)代碼:

https://github.com/fengdu78/C...

公開課 吳恩達 CS229

吳恩達在斯坦福教授的機器學(xué)習(xí)課程 CS229 與 吳恩達在 Coursera 上的《Machine Learning》相似,但是有更多的數(shù)學(xué)要求和公式的推導(dǎo),難度稍難一些。該課程對機器學(xué)習(xí)和統(tǒng)計模式識別進行了廣泛的介紹。

課程主頁:

http://cs229.stanford.edu/

中文視頻:

http://open.163.com/special/o...

中文筆記:

https://kivy-cn.github.io/Sta...

速查表:

這份給力的資源貢獻者是一名斯坦福的畢業(yè)生 Shervine Amidi。作者整理了一份超級詳細的關(guān)于 CS229的速查表

https://zhuanlan.zhihu.com/p/...

作業(yè)代碼:

https://github.com/Sierkinhan...

公開課 林軒田《機器學(xué)習(xí)基石》

臺灣大學(xué)林軒田老師的《機器學(xué)習(xí)基石》課程由淺入深、內(nèi)容全面,基本涵蓋了機器學(xué)習(xí)領(lǐng)域的很多方面。其作為機器學(xué)習(xí)的入門和進階資料非常適合。而且林老師的教學(xué)風(fēng)格也很幽默風(fēng)趣,總讓讀者在輕松愉快的氛圍中掌握知識。這門課比 Ng 的《Machine Learning》稍難一些,側(cè)重于機器學(xué)習(xí)理論知識。

中文視頻:

https://www.bilibili.com/vide...

中文筆記:

https://redstonewill.com/cate...

配套教材

配套書籍為《Learning From Data》,在線書籍主頁:http://amlbook.com/

公開課 林軒田《機器學(xué)習(xí)技法》

《機器學(xué)習(xí)技法》課程是《機器學(xué)習(xí)基石》的進階課程。主要介紹了機器學(xué)習(xí)領(lǐng)域經(jīng)典的一些算法,包括支持向量機、決策樹、隨機森林、神經(jīng)網(wǎng)絡(luò)等等。難度要略高于《機器學(xué)習(xí)基石》,具有很強的實用性。

中文視頻:

https://www.bilibili.com/vide...

中文筆記:

https://redstonewill.com/cate...

書籍 《機器學(xué)習(xí)》

周志華的《機器學(xué)習(xí)》被大家親切地稱為“西瓜書”。這本書非常經(jīng)典,講述了機器學(xué)習(xí)核心數(shù)學(xué)理論和算法,適合有作為學(xué)校的教材或者中階讀者自學(xué)使用,入門時學(xué)習(xí)這本書籍難度稍微偏高了一些。

配合《機器學(xué)習(xí)實戰(zhàn)》一起學(xué)習(xí),效果更好!

讀書筆記:

https://www.cnblogs.com/limit...

公式推導(dǎo):

https://datawhalechina.github...

課后習(xí)題:

https://zhuanlan.zhihu.com/c_...

書籍 《統(tǒng)計學(xué)習(xí)方法》

李航的這本《統(tǒng)計學(xué)習(xí)方法》堪稱經(jīng)典,包含更加完備和專業(yè)的機器學(xué)習(xí)理論知識,作為夯實理論非常不錯。

講課 PPT:

https://github.com/fengdu78/l...

讀書筆記:

http://www.cnblogs.com/limitl...

https://github.com/SmirkCao/L...

參考筆記:

https://zhuanlan.zhihu.com/p/...

代碼實現(xiàn):

https://github.com/fengdu78/l...

書籍《Scikit-Learn 與 TensorFlow 機器學(xué)習(xí)實用指南》

在經(jīng)過前面的學(xué)習(xí)之后,這本《Scikit-Learn 與 TensorFlow 機器學(xué)習(xí)實用指南》非常適合提升你的機器學(xué)習(xí)實戰(zhàn)編程能力。

這本書分為兩大部分,第一部分介紹機器學(xué)習(xí)基礎(chǔ)算法,每章都配備 Scikit-Learn 實操項目;第二部分介紹神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí),每章配備 TensorFlow 實操項目。如果只是機器學(xué)習(xí),可先看第一部分的內(nèi)容。

全書代碼:

https://github.com/ageron/han...

實戰(zhàn) Kaggle 比賽

比賽是提升自己機器學(xué)習(xí)實戰(zhàn)能力的最有效的方式,首選 Kaggle 比賽。

Kaggle 主頁:

https://www.kaggle.com/

Kaggle 路線:

https://github.com/apachecn/k...

工具 Scikit-Learn 官方文檔

Scikit-Learn 作為機器學(xué)習(xí)一個非常全面的庫,是一份不可多得的實戰(zhàn)編程手冊。

官方文檔:

https://scikit-learn.org/stab...

中文文檔(0.19):

http://sklearn.apachecn.org/#/

深度學(xué)習(xí)

公開課 吳恩達《Deep Learning》

在吳恩達開設(shè)了機器學(xué)習(xí)課程之后,發(fā)布的《Deep Learning》課程也備受好評,吳恩達老師的課程最大的特點就是將知識循序漸進的傳授給你,是入門學(xué)習(xí)不可多得良好視頻資料。

整個專題共包括五門課程:01.神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí);02.改善深層神經(jīng)網(wǎng)絡(luò)-超參數(shù)調(diào)試、正則化以及優(yōu)化;03.結(jié)構(gòu)化機器學(xué)習(xí)項目;04.卷積神經(jīng)網(wǎng)絡(luò);05.序列模型。

課程視頻

網(wǎng)易云課堂:

https://mooc.study.163.com/un...

Coursera:

https://www.coursera.org/spec...

課程筆記

之前編寫過吳恩達老師機器學(xué)習(xí)個人筆記黃海廣博士帶領(lǐng)團隊整理了中文筆記:

https://github.com/fengdu78/d...

參考論文

吳恩達老師在課程中提到了很多優(yōu)秀論文,黃海廣博士整理如下:

https://github.com/fengdu78/d...

課程PPT及課后作業(yè)

吳恩達深度學(xué)習(xí)課程,包含課程的課件、課后作業(yè)和一些其他資料:

https://github.com/stormstone...

公開課 Fast.ai《程序員深度學(xué)習(xí)實戰(zhàn)》

說到深度學(xué)習(xí)的公開課,與吳恩達《Deep Learning》并駕齊驅(qū)的另一門公開課便是由Fast.ai出品的《程序員深度學(xué)習(xí)實戰(zhàn)》。這門課最大的特點便是“自上而下”而不是“自下而上”,是絕佳的通過實戰(zhàn)學(xué)習(xí)深度學(xué)習(xí)的課程。

視頻地址

B站地址(英文字幕):

https://www.bilibili.com/vide...

CSDN地址(2017版中文字幕):

https://edu.csdn.net/course/d...

課程筆記

英文筆記原文:

https://medium.com/@hiromi_su...

由ApacheCN組織的中文翻譯:

https://github.com/apachecn/f...

公開課 CS230 Deep Learning

斯坦福的深度學(xué)習(xí)課程CS230在4月2日剛剛開課,對應(yīng)的全套PPT也隨之上線。從內(nèi)容來看,今年的課程與去年的差別不大,涵蓋了CNNs, RNNs, LSTM, Adam, Dropout, BatchNorm, Xavier/He initialization 等深度學(xué)習(xí)的基本模型,涉及醫(yī)療、自動駕駛、手語識別、音樂生成和自然語言處理等領(lǐng)域。

Datawhale整理了該門課程的詳細介紹及參考資料:

吳恩達CS230深度學(xué)習(xí)開課了!視頻配套PPT應(yīng)有盡有

書籍 神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí) - 復(fù)旦邱錫鵬

本書是入門深度學(xué)習(xí)領(lǐng)域的極佳教材,主要介紹了神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)中的基礎(chǔ)知識、主要模型(前饋網(wǎng)絡(luò)、卷積網(wǎng)絡(luò)、循環(huán)網(wǎng)絡(luò)等)以及在計算機視覺、自然語言處理等領(lǐng)域的應(yīng)用。

復(fù)旦教授邱錫鵬開源發(fā)布《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)》

書籍 《深度學(xué)習(xí)》

完成以上學(xué)習(xí)后,想要更加系統(tǒng)的建立深度學(xué)習(xí)的知識體系,閱讀《深度學(xué)習(xí)》準沒錯。該書從淺入深介紹了基礎(chǔ)數(shù)學(xué)知識、機器學(xué)習(xí)經(jīng)驗以及現(xiàn)階段深度學(xué)習(xí)的理論和發(fā)展,它能幫助人工智能技術(shù)愛好者和從業(yè)人員在三位專家學(xué)者的思維帶領(lǐng)下全方位了解深度學(xué)習(xí)。

書籍介紹

《深度學(xué)習(xí)》通常又被稱為花書,深度學(xué)習(xí)領(lǐng)域最經(jīng)典的暢銷書。由全球知名的三位專家IanGoodfellow、YoshuaBengio和AaronCourville撰寫,是深度學(xué)習(xí)領(lǐng)域奠基性的經(jīng)典教材。該書被大眾尊稱為“AI圣經(jīng)”。

在線閱讀

該書由眾多網(wǎng)友眾包翻譯,電子版在以下地址獲得:

https://github.com/exacity/de...

書籍 《深度學(xué)習(xí) 500 問》

當(dāng)你看完了所有的視頻,研習(xí)了AI圣經(jīng),一定充滿了滿腦子問號,此時不如來深度學(xué)習(xí)面試中常見的500個問題。

書籍介紹

DeepLearning-500-questions,作者是川大的一名優(yōu)秀畢業(yè)生談繼勇。該項目以深度學(xué)習(xí)面試問答形式,收集了 500 個問題和答案。內(nèi)容涉及了常用的概率知識、線性代數(shù)、機器學(xué)習(xí)、深度學(xué)習(xí)、計算機視覺等熱點問題,該書目前尚未完結(jié),卻已經(jīng)收獲了Github 2.4w stars。

項目地址:

https://github.com/scutan90/D...

工具 TensorFlow 官方文檔

學(xué)深度學(xué)習(xí)一定離不開TensorFlow

官方文檔:

https://www.tensorflow.org/ap...

中文文檔:

https://github.com/jikexueyua...

工具 PyTorch官方文檔

PyTorch是學(xué)深度學(xué)習(xí)的另一個主流框架

官方文檔:

https://pytorch.org/docs/stab...

中文文檔(版本0.3):

https://github.com/apachecn/p...

強化學(xué)習(xí)

公開課 Reinforcement Learning-David Silver

與吳恩達的課程對于機器學(xué)習(xí)和深度學(xué)習(xí)初學(xué)者的意義相同,David Silver的這門課程絕對是大多數(shù)人學(xué)習(xí)強化學(xué)習(xí)必選的課程。

課程從淺到深,把強化學(xué)習(xí)的內(nèi)容娓娓道來,極其詳盡。不過由于強化學(xué)習(xí)本身的難度,聽講這門課還是有一定的門檻,建議還是在大致了解這個領(lǐng)域之后觀看該視頻學(xué)習(xí)效果更佳,更容易找到學(xué)習(xí)的重點。

視頻地址

B站地址(中文字幕):

https://www.bilibili.com/vide...

課程原地址:

https://www.youtube.com/watch...

課程資料

課程PPT:

http://www0.cs.ucl.ac.uk/staf...

課程筆記:

https://www.zhihu.com/people/...

公開課 李宏毅《深度強化學(xué)習(xí)》

David Silver的課程雖然內(nèi)容詳盡,但前沿的很多內(nèi)容都沒有被包括在內(nèi),這時,臺大李宏毅的《深度強化學(xué)習(xí)》就是學(xué)習(xí)前沿動態(tài)的不二之選。

視頻地址

B站地址(中文字幕):

https://www.bilibili.com/vide...

課程原地址:

https://www.youtube.com/watch...

課程資料

課程PPT:

http://speech.ee.ntu.edu.tw/~...

課程筆記:

https://blog.csdn.net/cindy_1...

前沿Paper

1 Arxiv

Arxiv Stats

Arxiv 機器學(xué)習(xí)最新論文檢索主頁地址:

https://arxiv.org/list/stat.M...

Arxiv Sanity Preserver

Andrej Karpathy 開發(fā)了 Arxiv Sanity Preserver,幫助分類、搜索和過濾特征

主頁地址:

http://www.arxiv-sanity.com/?...

2 Papers with Code

Papers with Code(Browse state-of-the-art)

這個網(wǎng)站叫做 Browse state-of-the-art。它將 ArXiv 上的最新深度學(xué)習(xí)論文與 GitHub 上的開源代碼聯(lián)系起來。該項目目前包含了 651 個排行榜,1016 個深度學(xué)習(xí)任務(wù),795 個數(shù)據(jù)集,以及重磅的 10257 個含復(fù)現(xiàn)代碼的優(yōu)秀論文。簡直就是一個尋找論文和代碼的利器。它將 1016 個深度學(xué)習(xí)任務(wù)分成了 16 大類,涉及了深度學(xué)習(xí)的各個方面。

主頁地址:

https://paperswithcode.com/sota

舉兩個例子:

CV:

https://paperswithcode.com/ar...

NLP:

https://paperswithcode.com/ar...

Papers with Code(Sorted by stars)

這份資源收集了 AI 領(lǐng)域從 2013 - 2018 年所有的論文,并按照在 GitHub 上的標星數(shù)量進行排序。

GitHub 項目地址:

https://github.com/zziz/pwc

3 Deep Learning Papers 閱讀路線

如果你是深度學(xué)習(xí)領(lǐng)域的新手,你可能會遇到的第一個問題是“我應(yīng)該從哪篇論文開始閱讀?”下面是一個深入學(xué)習(xí)論文的閱讀路線圖!

GitHub 項目地址:

https://github.com/floodsung/...

這份深度學(xué)習(xí)論文閱讀路線分為三大塊:

1 Deep Learning History and Basics

2 Deep Learning Method

3 Applications

4 Deep Learning Object Detection

目標檢測(Object Detection)是深度學(xué)習(xí) CV 領(lǐng)域的一個核心研究領(lǐng)域和重要分支??v觀 2013 年到 2019 年,從最早的 R-CNN、Fast R-CNN 到后來的 YOLO v2、YOLO v3 再到今年的 M2Det,新模型層出不窮,性能也越來越好!

本資源對目標檢測近幾年的發(fā)展和相關(guān)論文做出一份系統(tǒng)介紹,總結(jié)一份超全的文獻 paper 列表。

GitHub 項目地址:

https://github.com/hoya012/de...

5 知名會議

會議

NeurIPS:https://nips.cc/

ICML:https://icml.cc/

ICLR:https://iclr.cc/

AAAI:https://aaai.org/Conferences/...

IJCAI:https://www.ijcai.org/

UAI:http://www.auai.org/uai2019/i...

計算機視覺:

CVPR:http://cvpr2019.thecvf.com/

ECCV:https://eccv2018.org/program/...

ICCV:http://iccv2019.thecvf.com/

自然語言處理:

ACL:http://www.aclcargo.com/

EMNLP:https://www.aclweb.org/portal...

NAACL:https://naacl2019.org/

知名期刊:

JAIR:https://www.jair.org/index.ph...

JMLR:http://www.jmlr.org/

其它

機器人方面,有 CoRL(學(xué)習(xí))、ICAPS(規(guī)劃,包括但不限于機器人)、ICRA、IROS、RSS;

對于更理論性的研究,有 AISTATS、COLT、KDD。

理論應(yīng)用

自然語言處理 1 NLP是什么

自然語言處理(NLP,Natural Language Processing)是研究計算機處理人類語言的一門技術(shù),目的是彌補人類交流(自然語言)和計算機理解(機器語言)之間的差距。NLP包含句法語義分析、信息抽取、文本挖掘、機器翻譯、信息檢索、問答系統(tǒng)和對話系統(tǒng)等領(lǐng)域。

2 課程推薦

CS224n 斯坦福深度自然語言處理課

17版中文字幕:

https://www.bilibili.com/vide...

課程筆記:

http://www.hankcs.com/?s=CS22...

2019版課程主頁:

http://web.stanford.edu/class...

自然語言處理 - Dan Jurafsky 和 Chris Manning

B站英文字幕版:

https://www.bilibili.com/vide...

學(xué)術(shù)激流網(wǎng):

http://academictorrents.com/d...

3 書籍推薦

Python自然語言處理

入門讀物,整本書不僅涉及了語料庫的操作,也對傳統(tǒng)的基于規(guī)則的方法有所涉及。全書包括了分詞(tokenization)、詞性標注(POS)、語塊(Chunk)標注、句法剖析與語義剖析等方面,是nlp中不錯的一本實用教程。

自然語言處理綜論

By Daniel Jurafsky和James H. Martin

本書十分權(quán)威,是經(jīng)典的NLP教科書,涵蓋了經(jīng)典自然語言處理、統(tǒng)計自然語言處理、語音識別和計算語言學(xué)等方面。

統(tǒng)計自然語言處理基礎(chǔ)

By Chris Manning和HinrichSchütze

更高級的統(tǒng)計NLP方法,在統(tǒng)計基本部分和n元語法部分介紹得都很不錯。

4 博客推薦

我愛自然語言處理

地址:http://www.52nlp.cn/

TFIDF、文檔相似度等等在這個網(wǎng)站上都有通俗易懂的解釋

語言日志博客(Mark Liberman)

地址:

http://languagelog.ldc.upenn....

natural language processing blog

地址:https://nlpers.blogspot.com/

美國Hal Daumé III維護的一個natural language processing的 博客,經(jīng)常評論最新學(xué)術(shù)動態(tài),值得關(guān)注。有關(guān)于ACL、NAACL等學(xué)術(shù)會議的參會感想和對論文的點評

5 項目推薦

基于LSTM的中文問答系統(tǒng)

https://github.com/S-H-Y-GitH...

基于RNN的文本生成器

https://github.com/karpathy/c...

基于char-rnn的汪峰歌詞生成器

https://github.com/phunterlau...

用RNN生成手寫數(shù)字

https://github.com/skaae/lasa...

6 開源NLP工具包

中文NLP相關(guān):https://github.com/crownpku/A...

英文NLP相關(guān):

NLTK: http://www.nltk.org/

TextBlob: http://textblob.readthedocs.o...

Gensim: http://radimrehurek.com/gensim/

Pattern: http://www.clips.ua.ac.be/pat...

Spacy: http://spacy.io

Orange: http://orange.biolab.si/featu...

Pineapple: https://github.com/proycon/py...

7 相關(guān)論文

100 Must-Read NLP Papers

https://github.com/mhagiwara/...

計算機視覺 1 計算機視覺的應(yīng)用

計算機視覺的應(yīng)用

無人駕駛

無人安防

人臉識別

車輛車牌識別

以圖搜圖

VR/AR

3D重構(gòu)

無人機

醫(yī)學(xué)圖像分析

其他

2 課程推薦

Stanford CS223B

比較適合基礎(chǔ),適合剛剛?cè)腴T的同學(xué),跟深度學(xué)習(xí)的結(jié)合相對來說會少一點,不會整門課講深度學(xué)習(xí),而是主要講計算機視覺,方方面面都會講到

李飛飛:CS231n課程:

https://mp.weixin.qq.com/s/-N...

3 書籍推薦

1.入門學(xué)習(xí):

《Computer Vision:Models, Learning and Inference》

2.經(jīng)典權(quán)威的參考資料:

《Computer Vision:Algorithms and Applications》

3.理論實踐:

《OpenCV3編程入門》

推薦系統(tǒng) 1 推薦系統(tǒng)是什么

推薦系統(tǒng)就是自動聯(lián)系用戶和物品的一種工具,它能夠在信息過載的環(huán)境中幫助用戶發(fā)現(xiàn)令他們感興趣的信息,也能將信息推送給對它們感興趣的用戶。推薦系統(tǒng)屬于資訊過濾的一種應(yīng)用。

2 推薦課程

推薦系統(tǒng)專項課程《Recommender Systems Specialization》

這個系列由4門子課程和1門畢業(yè)項目課程組成,包括推薦系統(tǒng)導(dǎo)論,最近鄰協(xié)同過濾,推薦系統(tǒng)評價,矩陣分解和高級技術(shù)等。

觀看地址:

https://www.coursera.org/spec...

3 書籍推薦

《推薦系統(tǒng)實踐》(項亮 著)

《推薦系統(tǒng)》(Dietmar Jannach等 著,蔣凡 譯)

《用戶網(wǎng)絡(luò)行為畫像》(牛溫佳等 著)

《Recommender Systems Handbook》(Paul B·Kantor等 著)

4 算法庫

LibRec

LibRec是一個Java版本的覆蓋了70余個各類型推薦算法的推薦系統(tǒng)開源算法庫,由國內(nèi)的推薦系統(tǒng)大牛郭貴冰創(chuàng)辦,目前已更新到2.0版本,它有效地解決了評分預(yù)測和物品推薦兩大關(guān)鍵的推薦問題。

項目地址: https://github.com/guoguibing...

官網(wǎng)地址: https://www.librec.net/

LibMF

C++版本開源推薦系統(tǒng),主要實現(xiàn)了基于矩陣分解的推薦系統(tǒng)。針對SGD(隨即梯度下降)優(yōu)化方法在并行計算中存在的 locking problem 和 memory discontinuity問題,提出了一種 矩陣分解的高效算法FPSGD(Fast Parallel SGD),根據(jù)計算節(jié)點的個數(shù)來劃分評分矩陣block,并分配計算節(jié)點。

項目地址:

http://www.csie.ntu.edu.tw/~c...

SurPRISE

一個Python版本的開源推薦系統(tǒng),有多種經(jīng)典推薦算法

項目地址:http://surpriselib.com/

Neural Collaborative Filtering

神經(jīng)協(xié)同過濾推薦算法的Python實現(xiàn)

項目地址:

https://github.com/hexiangnan...

Crab

基于Python開發(fā)的開源推薦軟件,其中實現(xiàn)有item和user的協(xié)同過濾

項目地址:http://muricoca.github.io/crab/

5 常用數(shù)據(jù)集

MovieLen

https://grouplens.org/dataset...

MovieLens數(shù)據(jù)集中,用戶對自己看過的電影進行評分,分值為1~5。MovieLens包括兩個不同大小的庫,適用于不同規(guī)模的算法。小規(guī)模的庫是943個獨立用戶對1 682部電影作的10 000次評分的數(shù)據(jù);大規(guī)模的庫是6 040個獨立用戶對3 900部電影作的大約100萬次評分。適用于傳統(tǒng)的推薦任務(wù)

Douban

https://www.cse.cuhk.edu.hk/i...

Douban是豆瓣的匿名數(shù)據(jù)集,它包含了12萬用戶和5萬條電影數(shù)據(jù),是用戶對電影的評分信息和用戶間的社交信息,適用于社會化推薦任務(wù)。

BookCrossing

http://www2.informatik.uni-fr...

這個數(shù)據(jù)集是網(wǎng)上的Book-Crossing圖書社區(qū)的278858個用戶對271379本書進行的評分,包括顯式和隱式的評分。這些用戶的年齡等人口統(tǒng)計學(xué)屬性(demographic feature)都以匿名的形式保存并供分析。這個數(shù)據(jù)集是由Cai-Nicolas Ziegler使用爬蟲程序在2004年從Book-Crossing圖書社區(qū)上采集的。

6 推薦論文

經(jīng)典必讀論文整理,包括綜述文章、傳統(tǒng)經(jīng)典推薦文章、社會化推薦文章、基于深度學(xué)習(xí)的推薦系統(tǒng)文章、專門用于解決冷啟動的文章、POI相關(guān)的論文、利用哈希技術(shù)來加速推薦的文章以及推薦系統(tǒng)中經(jīng)典的探索與利用問題的相關(guān)文章等。

項目地址:

https://github.com/hongleizha...

7 推薦項目

1.今日頭條推薦系統(tǒng)機制介紹,面向內(nèi)容創(chuàng)作者。分享人:項亮,今日頭條推薦算法架構(gòu)師:

https://v.qq.com/x/page/f0800...

3分鐘了解今日頭條推薦系統(tǒng)原理

https://v.qq.com/x/page/g0534...

3.facebook是如何為十億人推薦好友的

https://code.facebook.com/pos...

4.Netflix的個性化和推薦系統(tǒng)架構(gòu)

http://techblog.netflix.com/2...

風(fēng)控模型(評分卡模型) 1 評分卡模型簡介

評分卡模型時在銀行、互金等公司與借貸相關(guān)業(yè)務(wù)中最常見也是最重要的模型之一。簡而言之它的作用就是對客戶進行打分,來對客戶是否優(yōu)質(zhì)進行評判。

根據(jù)評分卡模型應(yīng)用的業(yè)務(wù)階段不用,評分卡模型主要分為三大類:A卡(Application score card)申請評分卡、B卡(Behavior score card)行為評分卡、C卡(Collection score card)催收評分卡。其中申請評分卡用于貸前,行為評分卡用于貸中,催收評分卡用于貸后,這三種評分卡在我們的信貸業(yè)務(wù)的整個生命周期都至關(guān)重要。

2 推薦書籍

《信用風(fēng)險評分卡研究——基于SAS的開發(fā)與實施》

3 評分卡模型建模過程

樣本選取

確定訓(xùn)練樣本、測試樣本的觀察窗(特征的時間跨度)與表現(xiàn)窗(標簽的時間跨度),且樣本的標簽定義是什么?一般情況下風(fēng)險評分卡的標簽都是考慮客戶某一段時間內(nèi)的延滯情況。

特征準備

原始特征、衍生變量

數(shù)據(jù)清洗

根據(jù)業(yè)務(wù)需求對缺失值或異常值等進行處理

特征篩選

根據(jù)特征的IV值(特征對模型的貢獻度)、PSI(特征的穩(wěn)定性)來進行特征篩選,IV值越大越好(但是一個特征的IV值超過一定閾值可能要考慮是否用到未來數(shù)據(jù)),PSI越小越好(一般建模時取特征的PSI小于等于0.01)

對特征進行WOE轉(zhuǎn)換

即對特征進行分箱操作,注意在進行WOE轉(zhuǎn)換時要注重特征的可解釋性

建立模型

在建立模型過程中可根據(jù)模型和變量的統(tǒng)計量判斷模型中包含和不包含每個變量時的模型質(zhì)量來進行變量的二次篩選。

評分指標

評分卡模型一般關(guān)注的指標是KS值(衡量的是好壞樣本累計分部之間的差值)、模型的PSI(即模型整體的穩(wěn)定性)、AUC值等。

知識圖譜 1 知識圖譜是什么

知識圖譜是一種結(jié)構(gòu)化數(shù)據(jù)的處理方法,它涉及知識的提取、表示、存儲、檢索等一系列技術(shù)。從淵源上講,它是知識表示與推理、數(shù)據(jù)庫、信息檢索、自然語言處理等多種技術(shù)發(fā)展的融合。

2 推薦資料

為什么需要知識圖譜?什么是知識圖譜?——KG的前世今生

https://zhuanlan.zhihu.com/p/...

什么是知識圖譜?

https://zhuanlan.zhihu.com/p/...

智能搜索時代:知識圖譜有何價值?

https://zhuanlan.zhihu.com/p/...

百度王海峰:知識圖譜是 AI 的基石

http://www.infoq.com/cn/news/...

譯文|從知識抽取到RDF知識圖譜可視化

http://rdc.hundsun.com/portal...

3 主要內(nèi)容

3.1 知識提取

構(gòu)建kg首先需要解決的是數(shù)據(jù),知識提取是要解決結(jié)構(gòu)化數(shù)據(jù)生成的問題。我們可以用自然語言處理的方法,也可以利用規(guī)則。

3.1.1 使用規(guī)則

正則表達式

正則表達式(Regular Expression, regex)是字符串處 理的基本功。數(shù)據(jù)爬取、數(shù)據(jù)清洗、實體提取、關(guān)系提取,都離不開regex。

推薦資料入門:

精通正則表達式

regexper 可視化:例 [a-z]*(d{4}(D+))

pythex 在線測試正則表達式:

http://pythex.org/

推薦資料進階:

re2 :

Python wrapper for Google"s RE2 using Cython

https://pypi.python.org/pypi/...

Parsley :更人性化的正則表達語法

http://parsley.readthedocs.io...

中文分詞和詞性標注

分詞也是后續(xù)所有處理的基礎(chǔ),詞性(Part of Speech, POS)就是中學(xué)大家學(xué)過的動詞、名詞、形容詞等等的詞的分類。一般的分詞工具都會有詞性標注的選項。

推薦資料入門:

jieba 中文分詞包

https://github.com/fxsjy/jieba

中文詞性標記集

https://github.com/memect/kg-...

推薦資料進階:

genius 采用 CRF條件隨機場算法

https://github.com/duanhongyi...

Stanford CoreNLP分詞

https://blog.csdn.net/guolind...

命名實體識別

命名實體識別(NER)是信息提取應(yīng)用領(lǐng)域的重要基礎(chǔ)工具,一般來說,命名實體識別的任務(wù)就是識別出待處理文本中三大類(實體類、時間類和數(shù)字類)、七小類(人名、機構(gòu)名、地名、時間、日期、貨幣和百分比)命名實體。

推薦資料:

Stanford CoreNLP 進行中文命名實體識別

https://blog.csdn.net/guolind...

3.1.2 使用深度學(xué)習(xí)

使用自然語言處理的方法,一般是給定schema,從非結(jié)構(gòu)化數(shù)據(jù)中抽取特定領(lǐng)域的三元組(spo),如最近百度舉辦的比賽就是使用DL模型進行信息抽取。

序列標注

使用序列生出模型,主要是標記出三元組中subject及object的起始位置,從而抽取信息。

推薦資料:

序列標注問題

https://www.cnblogs.com/jiang...

seq2seq

使用seq2seq端到端的模型,主要借鑒文本摘要的思想,將三元組看成是非結(jié)構(gòu)化文本的摘要,從而進行抽取,其中還涉及Attention機制。

推薦資料:

seq2seq詳解

https://blog.csdn.net/irving_...

詳解從Seq2Seq模型到Attention模型

https://caicai.science/2018/1...

3.2 知識表示

知識表示(Knowledge Representation,KR,也譯為知識表現(xiàn))是研究如何將結(jié)構(gòu)化數(shù)據(jù)組織,以便于機器處理和人的理解的方法。

需要熟悉下面內(nèi)容:

JSON和YAML

json庫:

https://docs.python.org/2/lib...

PyYAML: 是Python里的Yaml處理庫

http://pyyaml.org/wiki/PyYAML

RDF和OWL語義:

http://blog.memect.cn/?p=871

JSON-LD

主頁:http://json-ld.org/

3.3 知識存儲

需要熟悉常見的圖數(shù)據(jù)庫

a.知識鏈接的方式:字符串、外鍵、URI

b.PostgreSQL及其JSON擴展

Psycopg包操作PostgreSQL

http://initd.org/psycopg/docs/

c.圖數(shù)據(jù)庫 Neo4j和OrientDB

1.Neo4j的Python接口 https://neo4j.com/developer/p...

2.OrientDB:http://orientdb.com/orientdb/

d.RDF數(shù)據(jù)庫Stardog

Stardog官網(wǎng):http://stardog.com/

3.4 知識檢索

需要熟悉常見的檢索技術(shù)

ElasticSearch教程:

http://joelabrahamsson.com/el...

4 相關(guān)術(shù)語及技術(shù)路線

本體:

https://www.zhihu.com/questio...

RDF:

https://www.w3.org/RDF/

Apache Jena:

https://jena.apache.org/

D2RQ:

http://d2rq.org/getting-started

4.1 Protege構(gòu)建本體系列

protege:

https://protege.stanford.edu/

protege使用:

https://zhuanlan.zhihu.com/p/...

4.2 開發(fā)語言

python或java

4.3 圖數(shù)據(jù)庫技術(shù)

Neo4j:https://neo4j.com/

AllegroGraph:https://franz.com/agraph/alle...

4.4 可視化技術(shù)

d3.js:https://d3js.org/

Cytoscape.js:http://js.cytoscape.org/

4.5 分詞技術(shù)

jieba:https://github.com/fxsjy/jieba

hanlp:https://github.com/hankcs/HanLP

5 項目實戰(zhàn)

基于知識圖譜的問答:

https://github.com/kangzhun/K...

Agriculture_KnowledgeGraph:

https://github.com/qq54727654...

貢獻平臺

由知名開源平臺,AI技術(shù)平臺以及領(lǐng)域?qū)<遥篈pacheCN,Datawhale,AI有道和黃海廣博士聯(lián)合整理貢獻:

1.ApacheCN:片刻,李翔宇,飛龍,王翔

2.Datawhale:范晶晶,馬晶敏,李碧涵,李福,光城,居居,康兵兵,鄭家豪

3.AI有道:紅色石頭

4.黃海廣博士

平臺介紹

Datawhale

一個專注于AI領(lǐng)域的開源組織,上海交通大學(xué)國家級孵化項目,目前有7個獨立團隊,聚集了一群有開源精神和探索精神的團隊成員,匯聚了來自各個高校和企業(yè)的優(yōu)秀學(xué)習(xí)者,致力于構(gòu)建純粹的學(xué)習(xí)圈子和優(yōu)質(zhì)的開源項目,提供的組隊學(xué)習(xí)涵蓋了數(shù)據(jù)分析,數(shù)據(jù)挖掘,機器學(xué)習(xí),深度學(xué)習(xí),編程等16個內(nèi)容領(lǐng)域。

AI有道

一個專注于 AI 領(lǐng)域的技術(shù)公眾號。公眾號主要涉及人工智能領(lǐng)域 Python、ML 、CV、NLP 等前沿知識、干貨筆記和優(yōu)質(zhì)資源!我們致力于為廣大人工智能愛好者提供優(yōu)質(zhì)的 AI 資源和切實可行的 AI 學(xué)習(xí)路線。

黃博(機器學(xué)習(xí)初學(xué)者)

機器學(xué)習(xí)課程在國內(nèi)還不夠普及,大部分初學(xué)者還是很迷茫,走了很多彎路,黃海廣博士希望能盡自己的微薄之力,為機器學(xué)習(xí)初學(xué)者提供一個學(xué)習(xí)交流的平臺。

ApacheCN

一個致力于提供優(yōu)質(zhì)開源項目的開源組織,致力于AI文檔翻譯,Kaggle比賽交流、LeetCode算法刷題、大數(shù)據(jù)交流等項目。我們希望做出廣大 AI 愛好者真正需要的東西,打造真正有價值的長尾作品。

官方網(wǎng)址:http://www.apachecn.org/

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/19994.html

相關(guān)文章

  • 分享AI有道干貨 | 126 篇 AI 原創(chuàng)文章精選(ML、DL、資源、教程)

    摘要:值得一提的是每篇文章都是我用心整理的,編者一貫堅持使用通俗形象的語言給我的讀者朋友們講解機器學(xué)習(xí)深度學(xué)習(xí)的各個知識點。今天,紅色石頭特此將以前所有的原創(chuàng)文章整理出來,組成一個比較合理完整的機器學(xué)習(xí)深度學(xué)習(xí)的學(xué)習(xí)路線圖,希望能夠幫助到大家。 一年多來,公眾號【AI有道】已經(jīng)發(fā)布了 140+ 的原創(chuàng)文章了。內(nèi)容涉及林軒田機器學(xué)習(xí)課程筆記、吳恩達 deeplearning.ai 課程筆記、機...

    jimhs 評論0 收藏0
  • 第7期 Datawhale 組隊學(xué)習(xí)計劃

    馬上就要開始啦這次共組織15個組隊學(xué)習(xí) 涵蓋了AI領(lǐng)域從理論知識到動手實踐的內(nèi)容 按照下面給出的最完備學(xué)習(xí)路線分類 難度系數(shù)分為低、中、高三檔 可以按照需要參加 - 學(xué)習(xí)路線 - showImg(https://segmentfault.com/img/remote/1460000019082128); showImg(https://segmentfault.com/img/remote/...

    dinfer 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<