收藏 分享(赏)

《深度学习》课件第一章 概论.pptx

上传人:bubibi 文档编号:22692465 上传时间:2024-06-27 格式:PPTX 页数:44 大小:12.59MB
下载 相关 举报
《深度学习》课件第一章 概论.pptx_第1页
第1页 / 共44页
《深度学习》课件第一章 概论.pptx_第2页
第2页 / 共44页
《深度学习》课件第一章 概论.pptx_第3页
第3页 / 共44页
《深度学习》课件第一章 概论.pptx_第4页
第4页 / 共44页
《深度学习》课件第一章 概论.pptx_第5页
第5页 / 共44页
亲,该文档总共44页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第一章概论1.1深度学习的兴起1.2什么是深度学习?1.3为什么采用深度学习?1.4深度学习的应用of4311.5问题或挑战第一章 概论of4321.1 深度学习的兴起1989LeNet神经网络发展历程第一章 概论of4331.1 深度学习的兴起Phases of Neural Network Research1940s-1960s:Cybernetics:Brain like electronic systems,morphed into modern control theory and signal processing.1960s-1980s:Digital computers,aut

2、omata theory,computational complexity theory:simple shallow circuits are very limited in what they can represent1980s-1990s:Connectionism:complex,non-linear networks,back-propagation.1990s-2010s:Computational learning theory,graphical models:Learning is computationally hard,simple shallow circuits a

3、re very limited in what they can learn2006:Deep learning:End-to-end training,large datasets,explosion in applications.第一章 概论of4341.1 深度学习的兴起Citations of the“LeNet”paperRecall the LeNet was a modern visual classification network that recognized digits for zip codes.Its citations look like this:The 20

4、00s were a golden age for machine learning,and marked the ascent of graphical models.But not so for neural networks.Second phaseThird phaseDeep Learning“Winter”第一章 概论of4351.1 深度学习的兴起Yann Le Cun杨立昆Yoshua Bengio约书亚-本吉奥Geoffery Hinton杰弗里-辛顿深度学习领域的“三巨头”,2019年度的图灵奖获得者第一章 概论of4361.1 深度学习的兴起Yann Le Cun杨立昆Y

5、oshua Bengio约书亚-本吉奥Geoffery Hinton杰弗里-辛顿l反向传播l玻尔兹曼机l卷积神经网络的修正l卷积神经网络l改进反向传播算法l拓宽神经网络的视角l序列的概率建模l高维词嵌入与注意力机制l生成对抗网络of437第一章概论1.2什么是深度学习?1.1深度学习的兴起1.3为什么采用深度学习?1.4深度学习的应用第一章 概论of4381.2 什么是深度学习?深度学习浅层学习VS第一章 概论of4391.2 什么是深度学习?人工智能(Artificial Intelligence,AI)是研究使机器能模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科。机器学

6、习(Machine Learning,ML)是人工智能的核心,是实现人工智能的一个途径。实质上是设计和分析如何让机器从数据中“学习”潜在规律的算法。深度学习(Deep Learning,DL)是机器学习的一个重要分支,是一种以人工神经网络为架构,对数据进行表征学习的算法,用以模拟人脑逐层抽象和递归迭代的机制解译数据。逐层蕴含关系第一章 概论of43101.2 什么是深度学习?(1 1)深度学习的本质)深度学习的本质 通过构建多隐层的模型和海量训练数据(可以是无标签数据),来学习更有用的特征,从而提升分类或预测的准确性。(2 2)深度学习与传统的浅层学习的区别)深度学习与传统的浅层学习的区别 强

7、调了模型结构的深度,通常有5-10层以上,甚至上1000层的隐层节点;明确突出了特征学习的重要性,通过逐层特征变换,将数据样本变换以得到一个新的特征空间,从而使分类或预测更为准确。第一章 概论of43111.2 什么是深度学习?v学习算法在一个什么粒度上的特征表示,才能发挥作用?就一个图片来说,像素级的特征根本没有价值。例如下面的摩托车,从像素级别,根本得不到任何信息,其无法进行摩托车和非摩托车的区分。而如果特征是一个具有结构性的时候,比如是否具有车把手(handle),是否具有车轮(wheel),就很容易把摩托车和非摩托车区分,学习算法才能发挥作用。(3)(3)特征表示的粒度特征表示的粒度第

8、一章 概论of43121.2 什么是深度学习?SIFTSpin imageHoG(4 4)计算视觉特征)计算视觉特征Textons第一章 概论of43131.2 什么是深度学习?(5 5)什么是特征学习)什么是特征学习v从人脑视觉来看,从原始信号摄入开始(瞳孔摄入像素 Pixels),接着做初步处理(大脑皮层某些细胞发现边缘和方向),然后抽象(大脑判定眼前物体的形状),然后进一步抽象(大脑进一步判定该物体是人脸)第一章 概论of43141.2 什么是深度学习?What features can we learn if we train a massive model on a massive

9、amount of data.Can we learn a“grandmother cell”?vTrain on 10 million images(200200)(YouTube)v1 billion parametersv1000 machines(16,000 cores)for 1 week.vTest on novel imagesTop stimuli from the test setOptimal stimulus by numerical optimization第一章 概论of43151.2 什么是深度学习?v从文本来说从文本来说,对于一个描述一件事情的,对于一个描述一件

10、事情的docdoc文档文档,用什么来表示比较合,用什么来表示比较合适?适?首先是一个一个字,但字只是相当像素级别,起码应该有term(术语/词组);但这样表示概念的能力还不够,需要再进一步,达到topic级,有了topic,再到doc就较合理。但每个层次的数量差距很大,比如doc表示的概念-topic(千或万量级)-term(10万量级)-word(百万量级)。一个人在看一个一个人在看一个docdoc的时候,眼睛看到的是的时候,眼睛看到的是wordword,由这些,由这些wordword在大脑里在大脑里自动切词形成自动切词形成termterm,在按照概念组织的方式及先验的学习,得到,在按照概念

11、组织的方式及先验的学习,得到topictopic,然,然后再进行高层次的后再进行高层次的learninglearning。第一章 概论of43161.2 什么是深度学习?(6)(6)特征如何表示或刻画特征如何表示或刻画形状相似,方向不同形状相似,方向不同第一章 概论of43171.2 什么是深度学习?从未标注的声音中发现了从未标注的声音中发现了20种基本的声音结构种基本的声音结构第一章 概论of43181.2 什么是深度学习?Sparse(稀疏的)Selective(选择性的)Robusttodatacorruption(对污损数据是鲁棒的)深度特征表示:第一章 概论of43191.2 什么是

12、深度学习?(7)(7)深度学习的基本思想深度学习的基本思想v假设一个系统假设一个系统S,它有,它有n层(层(S1,Sn),输入是),输入是I,输出是,输出是O,形象地表示为:形象地表示为:I=S1=S2=.=Sn=O,如果输出,如果输出O等于输入等于输入I,即输入,即输入I经过这个系统变化之后没有任何的信息损经过这个系统变化之后没有任何的信息损失。这意味着输入失。这意味着输入I经过每一层经过每一层Si都没有任何的信息损失,即在都没有任何的信息损失,即在任何一层任何一层Si,它都是原有信息(即输入,它都是原有信息(即输入I)的另外一种表示。)的另外一种表示。v设计了一个系统设计了一个系统S(有(

13、有n层),通过调整系统中参数,使得它的层),通过调整系统中参数,使得它的输出仍然是输入,那么我们就可以自动地获取得到输入输出仍然是输入,那么我们就可以自动地获取得到输入I的一系的一系列层次特征,即列层次特征,即S1,Sn。第一章 概论of43201.2 什么是深度学习?深度学习=?Machine learning with big data(大数据的机器学习)Featurelearning(特征学习)Jointlearning(协同学习)Contextuallearning(上下文学习)第一章 概论of43211.2 什么是深度学习?v数据问题数据问题(包括下采样与高维数据预处理):(包括下采

14、样与高维数据预处理):稀疏编码、压缩感知、稀疏编码、压缩感知、流形学习、粗糙集等理论的应用流形学习、粗糙集等理论的应用。v结构问题:结构问题:是否有其他更为有效且有理论依据的深度模型构造方法是否有其他更为有效且有理论依据的深度模型构造方法?有什么正确的机理可以去增强一个给定的深度学习架构,以对扭?有什么正确的机理可以去增强一个给定的深度学习架构,以对扭曲和数据丢失的不变性具有鲁棒性?曲和数据丢失的不变性具有鲁棒性?v学习问题:如何设计行之有效的网络训练算法?学习问题:如何设计行之有效的网络训练算法?v信息融合问题:如何对于一个给定的深度学习架构,融合多种感知信息融合问题:如何对于一个给定的深度

15、学习架构,融合多种感知的信息?的信息?v完备的网络收敛性与稳定性理论。完备的网络收敛性与稳定性理论。深度学习的问题深度学习的问题of4322第一章概论1.3为什么采用深度学习?1.1深度学习的兴起1.2什么是深度学习?1.4深度学习的应用1.5问题或挑战第一章 概论of43231.3 为什么采用深度学习?深度学习模型具有更强的大数据量处理能力第一章 概论of43241.3 为什么采用深度学习?深度学习模型具有更强的特征表示能力第一章 概论of43251.3 为什么采用深度学习?深度学习模型的复杂度和模型学习能力of4326第一章概论1.4深度学习的应用1.1深度学习的兴起1.3为什么采用深度学

16、习?1.2什么是深度学习?1.5问题或挑战第一章 概论of43271.4 深度学习的应用行人交通违法抓拍行人交通违法抓拍人脸识别人脸识别AlphaGoAlphaGoDOTA2DOTA2深度深度学习学习生活中的深度学习应用第一章 概论of43281.4 深度学习的应用计算机视觉图像分类目标识别图像风格迁移目标跟踪第一章 概论of43291.4 深度学习的应用语音识别和自然语言处理语音识别问答系统机器翻译第一章 概论of43301.5 问题或挑战语音识别和自然语言处理语音识别问答系统机器翻译of4331第一章概论1.5问题与挑战1.1深度学习的兴起1.3为什么采用深度学习?1.2什么是深度学习?1

17、.4深度学习的应用Slides based on cs231n by Fei-Fei Li&Andrej Karpathy&Justin JohnsonComputer Vision Challenge DatasetsSlides based on cs231n by Fei-Fei Li&Andrej Karpathy&Justin JohnsonComputer Vision Deep NetworksSlides based on cs231n by Fei-Fei Li&Andrej Karpathy&Justin JohnsonComputer Vision Deep Networ

18、ksSlides based on cs231n by Fei-Fei Li&Andrej Karpathy&Justin JohnsonComputer Vision Deep NetworksSlides based on cs231n by Fei-Fei Li&Andrej Karpathy&Justin JohnsonImage Classification:a core task in Computer Visioncat(assume given set of discrete labels)dog,cat,truck,plane,.Slides based on cs231n

19、by Fei-Fei Li&Andrej Karpathy&Justin JohnsonThe problem:semantic gapImages are represented as 3D arrays of numbers,with integers between 0,255.E.g.300 x 100 x 3(3 for 3 color channels RGB)人对图像相似性的判别依据与计算机对相似性的判别依据之间的不同,造成了“语义鸿沟”问题Slides based on cs231n by Fei-Fei Li&Andrej Karpathy&Justin JohnsonCha

20、llenges:Viewpoint VariationSlides based on cs231n by Fei-Fei Li&Andrej Karpathy&Justin JohnsonChallenges:IlluminationSlides based on cs231n by Fei-Fei Li&Andrej Karpathy&Justin JohnsonChallenges:DeformationSlides based on cs231n by Fei-Fei Li&Andrej Karpathy&Justin JohnsonChallenges:OcclusionSlides based on cs231n by Fei-Fei Li&Andrej Karpathy&Justin JohnsonChallenges:Background clutterSlides based on cs231n by Fei-Fei Li&Andrej Karpathy&Justin JohnsonChallenges:Intraclass variation谢谢!

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 资格认证 > 计算职称

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:文库网官方知乎号:文库网

经营许可证编号: 粤ICP备2021046453号世界地图

文库网官网©版权所有2025营业执照举报