【超级重磅】626篇!机器学习&深度学习资料汇总(五)


【贡献者】ty4z2008、pkuphy、peimin、jappre、CSerxy

【整理者】ty4z2008

【源链接】https://github.com/ty4z2008/Qix/blob/master/dl.md

【备注】源链接为总链接,共包括626个子链接

【编辑】Major术业,在原文基础上,为每篇标记上序号,方便大家区分和查阅




401《How to Choose a Neural Network》

介绍:deeplearning4j官网提供的实际应用场景NN选择参考表,列举了一些典型问题建议使用的神经网络

402《Deep Learning (Python, C/C++, Java, Scala, Go)》

介绍:一个深度学习项目,提供了Python, C/C++, Java, Scala, Go多个版本的代码

403《Deep Learning Tutorials》

介绍:深度学习教程,github

404《自然语言处理的发展趋势——访卡内基梅隆大学爱德华·霍威教授》

介绍:自然语言处理的发展趋势——访卡内基梅隆大学爱德华·霍威教授.

405《FaceNet: A Unified Embedding for Face Recognition and Clustering》

介绍:Google对Facebook DeepFace的有力回击—— FaceNet,在LFW(Labeled Faces in the Wild)上达到99.63%准确率(新纪录),FaceNet embeddings可用于人脸识别、鉴别和聚类.

406《MLlib中的Random Forests和Boosting》

介绍:本文来自Databricks公司网站的一篇博客文章,由Joseph Bradley和Manish Amde撰写,文章主要介绍了Random Forests和Gradient-Boosted Trees(GBTs)算法和他们在MLlib中的分布式实现,以及展示一些简单的例子并建议该从何处上手.中文版.

407《Sum-Product Networks(SPN) 》

介绍:华盛顿大学Pedro Domingos团队的DNN,提供论文和实现代码.

408《Neural Network Dependency Parser》

介绍:基于神经网络的自然语言依存关系解析器(已集成至Stanford CoreNLP),特点是超快、准确,目前可处理中英文语料,基于《A Fast and Accurate Dependency Parser Using Neural Networks》 思路实现.

409《神经网络语言模型》

介绍:本文根据神经网络的发展历程,详细讲解神经网络语言模型在各个阶段的形式,其中的模型包含NNLM[Bengio,2003]、Hierarchical NNLM[Bengio, 2005], Log-Bilinear[Hinton, 2007],SENNA等重要变形,总结的特别好.

410《Classifying Spam Emails using Text and Readability Features》

介绍:经典问题的新研究:利用文本和可读性特征分类垃圾邮件。

411《BCI Challenge @ NER 2015》

介绍:Kaggle脑控计算机交互(BCI)竞赛优胜方案源码及文档,包括完整的数据处理流程,是学习Python数据处理和Kaggle经典参赛框架的绝佳实例

412《IPOL Journal · Image Processing On Line》

介绍:IPOL(在线图像处理)是图像处理和图像分析的研究期刊,每篇文章都包含一个算法及相应的代码、Demo和实验文档。文本和源码是经过了同行评审的。IPOL是开放的科学和可重复的研究期刊。我一直想做点类似的工作,拉近产品和技术之间的距离.

413《Machine learning classification over encrypted data》

介绍:出自MIT,研究加密数据高效分类问题.

414《purine2》

介绍:新加坡LV实验室的神经网络并行框架Purine: A bi-graph based deep learning framework,支持构建各种并行的架构,在多机多卡,同步更新参数的情况下基本达到线性加速。12块Titan 20小时可以完成Googlenet的训练。

415《Machine Learning Resources》

介绍:这是一个机器学习资源库,虽然比较少.但蚊子再小也是肉.有突出部分.此外还有一个由zheng Rui整理的机器学习资源.

416《Hands-on with machine learning》

介绍:Chase Davis在NICAR15上的主题报告材料,用Scikit-Learn做监督学习的入门例子.

417《The Natural Language Processing Dictionary》

介绍:这是一本自然语言处理的词典,从1998年开始到目前积累了成千上万的专业词语解释,如果你是一位刚入门的朋友.可以借这本词典让自己成长更快.

418《PageRank Approach to Ranking National Football Teams》

介绍:通过分析1930年至今的比赛数据,用PageRank计算世界杯参赛球队排行榜.

419《R Tutorial》

介绍:R语言教程,此外还推荐一个R语言教程An Introduction to R.

420《Fast unfolding of communities in large networks》

介绍:经典老文,复杂网络社区发现的高效算法,Gephi中的[Community detection](The Louvain method for community detection in large networks)即基于此.

421《NUML》

介绍: 一个面向 .net 的开源机器学习库,github地址

422《synaptic.Js》

介绍: 支持node.js的JS神经网络库,可在客户端浏览器中运行,支持LSTM等 github地址

423《Machine learning for package users with R (1): Decision Tree》

介绍: 决策树

424《Deep Learning, The Curse of Dimensionality, and Autoencoders》

介绍: 讨论深度学习自动编码器如何有效应对维数灾难,国内翻译

425《Advanced Optimization and Randomized Methods》

介绍: CMU的优化与随机方法课程,由A. Smola和S. Sra主讲,优化理论是机器学习的基石,值得深入学习 国内云(视频)

426《CS231n: Convolutional Neural Networks for Visual Recognition》

介绍: "面向视觉识别的CNN"课程设计报告集锦.近百篇,内容涉及图像识别应用的各个方面

427《Topic modeling with LDA: MLlib meets GraphX》

介绍:用Spark的MLlib+GraphX做大规模LDA主题抽取.

428《Deep Learning for Multi-label Classification》

介绍: 基于深度学习的多标签分类,用基于RBM的DBN解决多标签分类(特征)问题

429《Google DeepMind publications》

介绍: DeepMind论文集锦

430《kaldi》

介绍: 一个开源语音识别工具包,它目前托管在sourceforge上面

431《Data Journalism Handbook》

介绍: 免费电子书《数据新闻手册》, 国内有热心的朋友翻译了中文版,大家也可以在线阅读

432《Data Mining Problems in Retail》

介绍: 零售领域的数据挖掘文章.

433《Understanding Convolution in Deep Learning》

介绍: 深度学习卷积概念详解,深入浅出.

434《pandas: powerful Python data analysis toolkit》

介绍: 非常强大的Python的数据分析工具包.

435《Text Analytics 2015》

介绍: 2015文本分析(商业)应用综述.

436《Deep Learning libraries and ?rst experiments with Theano》

介绍: 深度学习框架、库调研及Theano的初步测试体会报告.

437《DEEP learning》

介绍: MIT的Yoshua Bengio, Ian Goodfellow, Aaron Courville著等人讲深度学习的新书,还未定稿,线上提供Draft chapters收集反馈,超赞!强烈推荐.

438《simplebayes》

介绍: Python下开源可持久化朴素贝叶斯分类库.

439《Paracel》

介绍:Paracel is a distributed computational framework designed for machine learning problems, graph algorithms and scientific computing in C++.

440《HanLP:Han Language processing》

介绍: 开源汉语言处理包.

441《Simple Neural Network implementation in Ruby》

介绍: 使用Ruby实现简单的神经网络例子.

442《Hacker's guide to Neural Networks》

介绍:神经网络黑客入门.

443《The Open-Source Data Science Masters》

介绍:好多数据科学家名人推荐,还有资料.

444《Text Understanding from Scratch》

介绍:实现项目已经开源在github上面Crepe

445《 Improving Distributional Similarity with Lessons Learned from Word Embeddings》

介绍:作者发现,经过调参,传统的方法也能和word2vec取得差不多的效果。另外,无论作者怎么试,GloVe都比不过word2vec.

446《CS224d: Deep Learning for Natural Language Processing》

介绍:Stanford深度学习与自然语言处理课程,Richard Socher主讲.

447《Math Essentials in Machine Learning》

介绍:机器学习中的重要数学概念.

448《Improved Semantic Representations From Tree-Structured Long Short-Term Memory Networks》

介绍:用于改进语义表示的树型LSTM递归神经网络,句子级相关性判断和情感分类效果很好.实现代码.

449《Statistical Machine Learning》

介绍:卡耐基梅隆Ryan Tibshirani和Larry Wasserman开设的机器学习课程,先修课程为机器学习(10-715)和中级统计学(36-705),聚焦统计理论和方法在机器学习领域应用.

450《AM207: Monte Carlo Methods, Stochastic Optimization》

介绍:《哈佛大学蒙特卡洛方法与随机优化课程》是哈佛应用数学研究生课程,由V Kaynig-Fittkau、P Protopapas主讲,Python程序示例,对贝叶斯推理感兴趣的朋友一定要看看,提供授课视频及课上IPN讲义.

451《生物医学的SPARK大数据应用》

介绍:生物医学的SPARK大数据应用.并且伯克利开源了他们的big data genomics系统ADAM,其他的内容可以关注一下官方主页.

452《ACL Anthology》

介绍:对自然语言处理技术或者机器翻译技术感兴趣的亲们,请在提出自己牛逼到无以伦比的idea(自动归纳翻译规律、自动理解语境、自动识别语义等等)之前,请通过谷歌学术简单搜一下,如果谷歌不可用,这个网址有这个领域几大顶会的论文列表,切不可断章取义,胡乱假设.

453《Twitter Sentiment Detection via Ensemble Classification Using Averaged Confidence Scores》

介绍:论文+代码:基于集成方法的Twitter情感分类,实现代码.

454《NIPS 2014 CIML workshop》

介绍:NIPS CiML 2014的PPT,NIPS是神经信息处理系统进展大会的英文简称.

455《CS231n: Convolutional Neural Networks for Visual Recognition》

介绍:斯坦福的深度学习课程的Projects 每个人都要写一个论文级别的报告 里面有一些很有意思的应用 大家可以看看 .

456《A Speed Comparison Between Flexible Linear Regression Alternatives in R》

介绍:R语言线性回归多方案速度比较具体方案包括lm()、nls()、glm()、bayesglm()、nls()、mle2()、optim()和Stan’s optimizing()等.

457《Back-to-Basics Weekend Reading - Machine Learning》

介绍:文中提到的三篇论文(机器学习那些事、无监督聚类综述、监督分类综述)都很经典,Domnigos的机器学习课也很精彩

458《A Probabilistic Theory of Deep Learning》

介绍:莱斯大学(Rice University)的深度学习的概率理论.

459《Nonsensical beer reviews via Markov chains》

介绍:基于马尔可夫链自动生成啤酒评论的开源Twitter机器人,github地址.

460《Deep Learning for Natural Language Processing (without Magic)》

介绍:视频+讲义:深度学习用于自然语言处理教程(NAACL13).

461《Introduction to Data Analysis using Machine Learning》

介绍:用机器学习做数据分析,David Taylor最近在McGill University研讨会上的报告,还提供了一系列讲机器学习方法的ipn,很有价值 GitHub.国内

462《Beyond Short Snippets: Deep Networks for Video Classification》

介绍:基于CNN+LSTM的视频分类,google演示.

463《How does Quora use machine learning in 2015?》

介绍:Quora怎么用机器学习.

464《Amazon Machine Learning – Make Data-Driven Decisions at Scale》

介绍:亚马逊在机器学习上面的一些应用,代码示例.

465《Parallel Machine Learning with scikit-learn and IPython》

介绍:并行机器学习指南(基于scikit-learn和IPython).notebook

466《Intro to machine learning with scikit-learn》

介绍:DataSchool的机器学习基本概念教学.

467《DeepCLn》

介绍:一个基于OpenGL实现的卷积神经网络,支持Linux及Windows系.

468《An Inside Look at the Components of a Recommendation Engine》

介绍:基于Mahout和Elasticsearch的推荐系统.

469《Forecasting in Economics, Business, Finance and Beyond》

介绍:Francis X. Diebold的《(经济|商业|金融等领域)预测方法.

470《Time Series Econometrics - A Concise Course》

介绍:Francis X. Diebold的《时序计量经济学》.

471《A comparison of open source tools for sentiment analysis》

介绍:基于Yelp数据集的开源情感分析工具比较,评测覆盖Naive Bayes、SentiWordNet、CoreNLP等 .

472《Pattern Recognition And Machine Learning》

介绍:国内Pattern Recognition And Machine Learning读书会资源汇总,各章pdf讲稿,博客.

473《Probabilistic Data Structures for Web Analytics and Data Mining 》

介绍:用于Web分析和数据挖掘的概率数据结构.

474《Machine learning in navigation devices: detect maneuvers using accelerometer and gyroscope》

介绍:机器学习在导航上面的应用.

475《Neural Networks Demystified 》

介绍:Neural Networks Demystified系列视频,Stephen Welch制作,纯手绘风格,浅显易懂,国内云.

476《swirl + DataCamp 》

介绍:{swirl}数据训练营:R&数据科学在线交互教程.

477《Learning to Read with Recurrent Neural Networks 》

介绍:关于深度学习和RNN的讨论 Sequence to Sequence Learning with Neural Networks.

478《深度强化学习(Deep Reinforcement Learning)的资源》

介绍:Deep Reinforcement Learning.

479《Machine Learning with Scikit-Learn》

介绍:(PyCon2015)Scikit-Learn机器学习教程,Parallel Machine Learning with scikit-learn and IPython.

480《PDNN》

介绍:PDNN: A Python Toolkit for Deep Learning.

481《Introduction to Machine Learning》

介绍:15年春季学期CMU的机器学习课程,由Alex Smola主讲,提供讲义及授课视频,很不错.国内镜像.

482《Big Data Processing》

介绍:大数据处理课.内容覆盖流处理、MapReduce、图算法等.

483《Spark MLlib: Making Practical Machine Learning Easy and Scalable》

介绍:用Spark MLlib实现易用可扩展的机器学习,国内镜像.

484《Picture: A Probabilistic Programming Language for Scene Perception》

介绍:以往上千行代码概率编程(语言)实现只需50行.

485《Beautiful plotting in R: A ggplot2 cheatsheet》

介绍:ggplot2速查小册子,另外一个,此外还推荐《A new data processing workflow for R: dplyr, magrittr, tidyr, ggplot2》.

486《Using Structured Events to Predict Stock Price Movement: An Empirical Investigation》

介绍:用结构化模型来预测实时股票行情.

487《International Joint Conference on Artificial Intelligence Accepted paper》

介绍:国际人工智能联合会议录取论文列表,大部分论文可使用Google找到.

488《Why GEMM is at the heart of deep learning》

介绍:一般矩阵乘法(GEMM)对深度学习的重要性.

489《Distributed (Deep) Machine Learning Common》

介绍:A Community of awesome Distributed Machine Learning C++ projects.

490《Reinforcement Learning: An Introduction》

介绍:免费电子书<强化学习介绍>,第一版(1998),第二版(2015草稿),相关课程资料,Reinforcement Learning.

491《Free ebook: Microsoft Azure Essentials: Azure Machine Learning》

介绍:免费书:Azure ML使用精要.

492《A Deep Learning Tutorial: From Perceptrons to Deep Networks》

介绍:A Deep Learning Tutorial: From Perceptrons to Deep Networks.

493《Machine Learning is Fun! - The world’s easiest introduction to Machine Learning》

介绍:有趣的机器学习:最简明入门指南,中文版.

494《A Brief Overview of Deep Learning》

介绍:深度学习简明介绍,中文版.

495《Wormhole》

介绍:Portable, scalable and reliable distributed machine learning.

496《convnet-benchmarks》

介绍:CNN开源实现横向评测,参评框架包括Caffe 、Torch-7、CuDNN 、cudaconvnet2 、fbfft、Nervana Systems等,NervanaSys表现突出.

497《This catalogue lists resources developed by faculty and students of the Language Technologies Institute.》

介绍:卡耐基梅隆大学计算机学院语言技术系的资源大全,包括大量的NLP开源软件工具包,基础数据集,论文集,数据挖掘教程,机器学习资源.

498《Sentiment Analysis on Twitter》

介绍:Twitter情感分析工具SentiTweet,视频+讲义.

499《Machine Learning Repository @ Wash U》

介绍:华盛顿大学的Machine Learning Paper Repository.

500《Machine learning cheat sheet》

介绍:机器学习速查表.

(未完待续......)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,736评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,167评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,442评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,902评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,302评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,573评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,847评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,562评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,260评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,531评论 2 245
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,021评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,367评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,016评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,068评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,827评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,610评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,514评论 2 269

推荐阅读更多精彩内容