200字范文,内容丰富有趣,生活中的好帮手!
200字范文 > 神经网络训练输入数据并行化

神经网络训练输入数据并行化

时间:2018-11-01 16:24:34

相关推荐

神经网络训练输入数据并行化

在训练神经网络的时候,有时候数据的读取处理所占用的时间比较长,像数据量非常大的情况,或者是3D的数据预处理比较耗内存的情况。此时我们希望并行化,即数据处理与训练同时进行。

参考:https://tensorpack.readthedocs.io/tutorial/extend/input-source.html

图片上为两种数据处理的方式:并行化和串行化。

并行化:在处理数据的时候并进行训练,当gpu空闲的时候,已经训练好的数据能够及时的喂到显存中。串行化:必须对数据进行处理之后才可以送到gpu,gpu才可以开始工作,在数据处理完之前,gpu一直处于空闲状态,大大的浪费了资源。

在网络的训练过程中,必须要明确一点:在训练的同时准备数据!!

有三个原因:

数据准备通常会消耗大量的时间(取决于实际问题)。数据准备通常使用与训练时使用完全不同的资源(参见上面的图)——一起做并不会降低整体的速度。事实上,可以在准备过程中进一步并行化为不同的阶段,因为它们也使用不同的资源,即不论并行还是串行使用的都是不同的资源。数据准备通常不依赖于前一个训练步骤的结果。

让我们做一些简单的计算:根据tensorflow/benchmarks,4个P100 gpu可以以每秒852张图像的速度训练ResNet50,这些图像的大小为85222422434bytes = 489MB。假设您有5GB/s memcpy带宽(如果您运行单线程复制),简单地复制一次数据就需要0.1秒——这会使您的训练速度降低10%。考虑一下在预处理过程中还要复制多少份。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。