深度学习依赖于神经网络所提取的特征而闻名,在以往传统的学习方法中,特征往往是通过具有经验的专家来提取的,而深度学习方法中的特征提取是通过人工神经网络自动提取的,相比而言,深度学习方法对于特征的提取不仅要求更低,不需要专家的参与,而且少了人为的干预,对于特征本身的提取也更加全面,这也是深度学习最近几年在实际应用中越来越受欢迎的原因之一。
学习神经网络,虽然sgd、反向传播、CNN都看懂了,但最基础的感知机却有疑惑,单层(输入输出两层)感知机只能线性很容易理解,但为何多层感知机就可以表达非线性空间?不用sigmoid等非线性激活函数,只是权重偏置之类的参数,多层叠加,就可以实现非线性表达?