Ⅰ 为什么深度学习要使用大量数据

利用大数据来学习,更能够刻画数据丰富的内在信息。

深度学习特点:

1、强调了模型结构的深度,通常有5层、6层,甚至10多层的隐层节点;

2、明确了特征学习的重要性。也就是说,通过逐层特征变换,将样本在原空间的特征表示变换到一个新特征空间,从而使分类或预测更容易。与人工规则构造特征的方法相比,利用大数据来学习特征,更能够刻画数据丰富的内在信息。

(1)深度学习数据集扩展阅读

深度学习有三大局限:

1、首先,深度学习几乎总是需要大量的标注数据。这使得视觉研究人员的焦点过度集中于容易标注的任务,而不是重要的任务。

2、其次,深网在基准数据集上表现良好,但在数据集之外的真实世界图像上,可能会出现严重失败。特别是,深网难以应付数据集中不经常发生的“罕见事件”。

而在现实世界的应用中,这些情况则会产生潜在风险,因为它们对应的视觉系统故障可能导致可怕的后果。比如,用于训练自动驾驶汽车的数据集几乎从不包含“婴儿坐在路上”的情况。

3、深网对图像中的变化过度敏感。这种过度敏感不仅反映在对图像中难以察觉变化的标准上,还反映在对上下文的变化上,由于数据集大小的局限,过度敏感会导致系统做出错误判断,但这种因过度敏感而导致的图像变化却难以欺骗人类观察者。