爱收集资源网

保姆级深度学习从零入门路线图,分享给大家!

网络整理 2022-05-08 19:06

强烈推荐刘建平先生的​​博客:刘建平Pinard - 博客园;

我非常感谢这个博客。那个时候看统计学习如何看qq群资料完整度,从零开始推公式。我遇到了很多问题。在这个博客上找到了答案。

当然,现在大部分学生都习惯看视频了,博客可能很难阅读。但是,我仍然建议您自己推动它。看视频、推公式只能靠自己。通读一遍,但不要完全掌握公式。

如果你看完后对如何开始深度学习感到困惑,可以参考我总结的学习路线图:

根据自己的入门和工作经验,用八千字,从零开始总结出一份超详细的奶妈级深度学习路线图,分享给大家;

整个思维导图的路线图分为六个部分:

基础知识;

机器学习理论导论;

机器学习竞赛实践;

深度学习理论导论;

深度学习大赛实战;

深度学习面试题总结;

整个路线图的思维导图如下,我把所有对应的视频和github链接都放在思维导图笔记里了;

也可以配合视频观看,也可以看视频介绍获取思维导图:

对于这六个部分,让我们一一来看:

1.基础知识学习

首先,我们来看看基础知识部分;

你需要掌握两个领域;第一个是数学,第二个是Python面向对象编程的基础

;

首先是数学,我想很多搜索入门路线图的朋友都会推荐很多数学方面的书籍、视频和科目,比如:微积分、线性代数、概率论、复函数、数值计算等;

我认为如果现在的任务是开始,而不是做一些开创性的研究,这些都不是没有必要的;

从忠告中,先掌握线性代数:向量、矩阵、运算、范数、特征向量和特征值;

这里推荐一个中文视频,【线性代数的两小时速习】;链接查看我的思维导图思维导图对应位置;

复习时,你不需要完全记住它,但你需要用你的笔记画一个大致的上下文图,并写下细节。以后需要用到的时候,比如你可以查字典;

其次,对于大数,你需要掌握四个主要的东西:导数、梯度、泰勒公式和概率论;概率论可以很快通过。 ,要了解一些基本的概念,比如条件概率、最大似然估计等,我这里推荐一个视频,【1小时概率论快速回顾】;链接查看我的思维导图思维导图对应的位置;

有了这些数据库,入门级的深度学习就足够了;之后,如果遇到不懂的东西,除此之外还可以学习;

第二个基础知识是Python;

Python是一种编程语言,是机器学习和深度学习中进行数据处理和模型实现的主要语言。

对于Python,不需要精通,只需要具备一定的Python面向对象编程知识基础就够了;

这里如何看qq群资料完整度,在理论上,我推荐廖雪峰的Python课程

本课程不必全部阅读,地址在思维导图备注中

本视频的内容并非都是要学习的,我们只需要从第一个介绍开始,学习常用的第三方模块即可;之后,如果你有一定的Python基础,就不需要学习了;

以后如果你需要提高自己的实战能力,我给你推荐一本书,这本书也很快学起来。它被称为[使用Python进行数据分析];

本书中文翻译版链接在此:见思维导图备注

这本书,你不需要通读,只看关键章节即可;当然,都读一遍,而且速度很快,因为书本身很容易学;

我为什么推荐这本书?首先,第一点,这本书看起来确实很简单,入门门槛极低。其次,本书的内容与我们未来的机器学习和深度学习息息相关,因为在我们建立模型之前,我们需要对数据进行很多操作,使用本书介绍的两个api包;

看完廖雪峰的教程和本书,你将掌握两件事,一是python的基础知识,二是如何在实践中使用Python处理数据;

2.机器学习理论导论

在第二部分,我将重点介绍机器学习理论入门的路线图;

p>

对于机器学习理论算法,我推荐一本书,一个博客和一个Python包

书是:李航的统计学习,主要是,不是全部,后面我会告诉你你读了哪些章节?

博客是刘建平老师的博客,Python包是sklearn;

我们先看这个统计学习,我讲三个原则:

三个原则是:

首先,作为初学者,不要把每一章都看一遍;

第二,不要用python从零开始造轮子来实现本书的算法,不要这样做,浪费时间;

第三,关键章节的算法必须能够手动推公式。关键算法不多,后面再说;

本书共分11章,您只需阅读6章:1、2、4、5、6、8

我带来了我们来看看这本书的目录:

第一章是统计学习的介绍;这一章是学习整个机器学习的一些基本概念,比如什么是回归问题,什么是分类问题;什么是正则化、什么是交叉验证、什么是过拟合等基本概念;必须掌握,没有商量的余地;

第2章是感知机,最简单的机器学习模型,以下

第 3 章是 K-Nearest Neighbor 算法,现在不用看,跳过;

第四章是朴素贝叶斯算法,这个很重要。里面的概念,比如后验概率、最大似然估计等,一定要掌握

第5章是决策树:这个很简单,就是如何选择特征,两个决策树算法;也是高手

第6章是逻辑回归和最大熵;见

第7章支持向量机,说说我的想法,我觉得这一章不用看;为什么?首先,在我自己的工作中,我几乎没有使用过支持向量机;而现在,今天,如果你在面试深度学习岗位,还有面试官还在要求你推SVM公式,我觉得这次面试官方是不合格的,这家公司可能不是你的好选择;

第8章Boosting树,必看,这个boosting树算法很重要;

第九章第十一章,你不用看;对于Hidden Markov和Conditional Random Fields,如果想深入学习NLP,可以再看一遍; EM算法,上手后遇到就可以阅读;

我刚才提到了关键算法,必须能够手动推公式,哪些是重要的?不多,逻辑回归、朴素贝叶斯、boosting tree中的xgboost算法;其他算法,你自己重复一遍,就够了;

在看的过程中,如果有看不懂怎么办?刚刚推荐了刘建平老师的博客;

这里:看思维导图备注

这个博客很好,有相应的理论介绍,还有使用sklearn的实现代码;

p>

我刚才还讲了一个规则,就是不要从头实现算法,因为sklearn可以很好的帮助你;

在这个过程中,你要弄清楚这个算法的输入数据,输出数据,每个参数的含义是什么;可以自己调整参数,看看不同参数下最终效果如何;但是这里不要花太多精力在参数调整上,因为你现在实现的代码这是一个demo,数据量很小,调整参数没有意义;什么是参数调整?待会儿再说;

整个机器学习理论部分,如果你真的努力学习,三周内绝对可以搞定;想看的话,一共看6章,每章可以看四天,这四天,中间看三天理论部分,每天跑一次代码熟悉一下感觉它可以在一个小时内完成;一章四天可以读完,三周读完没问题; ,也用sklearn做了简单的代码练习,接下来要做什么呢?将这些算法付诸实践;

也就是我要讲的机器学习大赛的代码实践:这里,我只推荐一本书,叫:

阿里巴巴云天池赛题解析-机器学习篇;

记住,这是机器学习章节,不是深度学习章节;

我先说要不要买这本书:首先我自己买了这本书,但是我发现这本书很厚,但是代码很多占空间;后来发现代码已经在天池上开源了,买了之后有点后悔;我为知识付费;

你要买吗?我觉得没必要,反正代码是开源的,后面会告诉你链接;但是如果你想支持这本书的作者,你可以买一本支持它;下次不要这样做;

天池是一个竞赛平台。本书包含四个实际任务:

工业蒸汽预测

天猫用户重复购买预测

O2O 优惠券预测

阿里巴巴云安全恶意软件程序检测

我会告诉你如何阅读这本书:

有四个任务,对吧?一两个任务,你不用全部看,没必要;

你如何确保彻底理解一两个任务?

七步:问题理解、数据探索、特征工程、模型训练、模型验证、特征优化、模型融合7步

我放了思维导图的开源代码Notes的链接;

就像我说的,从四个任务中挑一个或两个,一周看一个,7天,3天,7天2个,或者7天一个,比如第一个,就是足以彻底理解它;

看完之后,你会对之前学过的统计学习书籍中的机器学习算法有一个非常清晰的认识;

所以整个机器学习理论和代码时间,需要1个月;

4.深度学习理论学习

如何看qq群资料完整度_qq群完整填写群资料_qq群怎么改群资料

我把深度学习的介绍建模为机器学习,也分为两部分,先学理论,再玩游戏;

其实引入深度学习要比引入机器学习简单得多;

网上很多朋友在推荐深度学习入门路线的时候,都会谈到李牧的【动手深度学习】;我自己也在学这个课程,学到了很多;

但是发自内心的说,如果是带着初学者的角度去看这门课,可能会有不理解的情况;所以这门课可以先玩,推荐两个视频和一本书给大家;

我们都知道深度主要分为NLP和CV;

NLP任务大致可以分为四种:文本分类、文本匹配、序列标注文本生成,

CV Tasks也可以大致分为图像理解和生成:理解大致可以分为:分类、检测、分割、跟踪;生成基本上是一个GAN模型

对于入门,我们不需要学习这个更多,我们只需要基于学生身份的神经网络,然后通过文本分类和图像分类任务来熟悉整个许娜琳和预测过程,例如数据处理、模型构建等;

所以我推荐这两个课程也很有名:

就是人们常说的cs231n和CS224n;

我会告诉你如何观看这两个视频,而不是全部;

推荐视频cs231n;

B站视频链接见思维导图;

整个视频在B站共分33讲。作为介绍,主要是学习p1-p22;

即从第一讲介绍——计算机视觉概述到循环神经网络;

我们打开看看:

那么这个视频不适合你一直看。看完一个部分,去完成相应的作业;

它有三个作业,我把实现代码链接放在这里:看思维导图备注

你做前两个,实现图像分类任务,实现卷积神经网络

:bn,dropout,cnn都得看看;

第三个工作比较复杂,不用看,只需要做前两个即可;

请注意,您不需要从头开始做这项作业,只需查看您提供的代码库,看看其他人是如何实现的。当然,如果你有信心,想锻炼自己,你自己是做不到的。这个问题可以从头开始实现。但是对于大部分人来说,应该是一行一行的看代码,明白为什么写在这里,输出和输入是什么;

在这个过程中,会涉及到一个点,就是框架的学习,我推荐大家使用Pytorch;

框架学习,后面再说,这里插一句,就是大家可以去B站,刘二老师,地址在这里:看思维导图备注

它的pytorch学习曲线比较平滑。看完计算机视觉视频,大家就完成了代码部分。有不明白的,看刘二老师穿插的视频;

p>

因为刘二老师的这个视频会涉及到CNN和RNN,所以一开始看可能会有点吃力;

我举个例子,比如你看CNN网络,然后你去完成第二个作业,突然发现有一点看不懂,不知道为什么要做这样,然后你去刘二老师对应的视频,说一下CNN代码;就是这个顺序;

学完整个计算机城议会的视频和代码,你要掌握多少?

必须完全掌握以下内容:

反向传播梯度返回、损失函数、优化算法、多层感知器、卷积神经网络、普通循环神经网络,以及一些dropout和BN掌握;

2.自然语言处理

推荐一个视频,很经典的CS224n:

链接:见思维导图备注

本课程不需要全部阅读,只需要选择性观看:

在B站官方主页上,包含18个讲座;入门阶段,只需要看P1-P5和P8、P9、P11;

观看此视频你能走多远?

其实这个视频和cs231n在基本部分有重叠。基础部分大家都可以看,最好都学。

必须熟悉掌握:反向传播、词向量、RNN、GRU、Lstm、Seq2Seq和注意力机制;初步了解卷积神经网络;

如果你有家庭作业,你必须认真做。图备注

不是所有的作业都写完了:专注于a1、a2、a4、a5;其实a5不做也没问题,一定要经过上面给出的三个;

p>

作业涉及词向量和机器翻译;

经常有朋友跟我说,不知道att的细节是怎么实现的。其实这些都是最基本的。请务必从头开始阅读代码。有空可以自己实现,很有帮助;

在学习这两个视频的过程中,视频都是英文的,涉及到一些经典的概念。不容易理解,这本书你一定要看看:

邱锡鹏

在学习代码的过程中,不要太在意参数,重点是代码是怎么写的;因为在调整参数的技巧之后,我会有一个特殊的部分需要改进;

3.Pytorch 框架学习

pytorch框架学习:其实这个pytorch学习应该是整合在上面的计算机视觉学习中的;您可以仅在观看视频之后和写作业之前阅读此 Pytorch 教学视频;

"完整收藏

但是好像没有源代码。评论区的一些朋友输入了代码。地址在这里:

5.深度学习竞赛实践:

重点是上面提到的深度学习的东西,都是在为你打基础;

但是记住,我们学习深度学习是为了实战:我为大家准备了两个学习曲线非常流畅的实战项目;

一个是新闻分类项目,另一个是街景字符识别项目,即图片分类项目。可能有人会认为这两个项目很简单,但我认为你不应该低估这两个项目。如果你扎扎实实地完成这两个项目,肯定对你的帮助比你想象的要多;

先说NLP的新闻文本分类任务;地址在这里:见思维导图备注

正如我所说,这个任务是 NLP 中的一项基本任务——文本分类任务;这也是绝大多数从业者在日常工作中最常见的业务型NLP工程师的工作要求;因此掌握这项任务至关重要;

那么如何掌握呢?天池上有开源的竞赛题分析,我挑选了几本我觉得对你很不错的笔记本;

task1:理解竞赛题:

jupyter notebook 链接,见思维导图备注

就像操作员在你工作时给你的要求一样。听完需求后,需要分析问题出在哪里。这是一个分类问题、一个回归问题、一个 NLP 问题和一个 CV。问题,多模式问题?

task2:分析数据:看字符分布、最大长度、链接思维导图备注

task3:基于机器学习的文本分类任务:先做baseline,而不是先做大模型和复杂的事情;

链接见思维导图备注

task4:不同的深度学习模型:

fastext:是词向量,也是文本分类模型:对应论文链接在这里:对应我的博客解读,这里,链接见思维导图备注

w2C:视频中介绍了相应的论文链接。博客解读在这里

textcnn:就是跟CNN模型做的,链接见思维导图备注

textrnn:用RNN做,链接见思维导图备注

之前学过深度学习的视频,CNN、RNN等基础网络,你去实践一下这些模型;

伯特;可以先跳过这个,直到你进入深度学习的大门,如果你觉得你想追求NLP的方向,你可以去相关论文;我会把链接放在这里:

第二个任务是CV任务:图像分类任务:街景字符编码识别

p>

链接:见思维导图备注

task1竞赛题理解

链接见思维导图备注

任务数据读取和数据扩展添加

链接见思维导图备注

task3 构造

链接思维导图备注

task4模型训练,链接思维导图备注

task4模型的集成:

链接见思维导图备注

完成此任务后,您将进入CV领域,如果您加载自己的Image数据集,对如何构建CV模型、增强数据和模型验证有一个清晰的认识;

当这两个任务实现后,你可以调整参数,尝试各种技巧来提高你的成绩;

整个深度学习

面试题:

数百种机器学习;我会在视频结尾给大家提供这本书很好,真的很好;

机器学习 思维导图 深度学习