公务员期刊网 精选范文 卷积在神经网络中的作用范文

卷积在神经网络中的作用精选(九篇)

卷积在神经网络中的作用

第1篇:卷积在神经网络中的作用范文

[关键词]卷积网络,mnist,深度学习;

中图分类号:TP391 文献标识码:A 文章编号:1009-914X(2017)02-0168-01

1 概述

几年来,深度卷积网络技术飞速发展,在图像,语音,自然语言处理等多个人工智能领域纷纷取得领先。深度卷积网络作为深度神经网络的一种,其具有独特的类似于人眼局部感受野的卷积核,以及类似于生物神经的层次级联结构。由于权值共享的特性,网络的参数大大减少,同时降低了对训练数据过拟合的风险,具有比其他种类的深度网络更加易于训练的好处。

2 深度卷积网络

2.1 深度卷积层的结构

一个典型的深度卷积网络结构如图2-1所示。

深度卷积网络的第一层是输入层,接下来是若干个卷基层和下采样层,最后是一个分类器,如softmax分类器,由分类器输出相应的分类结果。通常,每一个卷基层后面都紧跟一个下采样层。在卷基层,利用局部连接和权值共享可以减少网络的训练参数,降低计算的复杂性。通过卷积运算,得到的卷积结果通过sigmoid等激活函数的输出得到这一层的特征图,然后作为下一层(下采样层)的输入。在下采样层。将前一层对应的特征图中相邻若干个特征通过池化操作合并成一个特征。输入的图像数据可以直接传送到第一个卷积层,进行逐层特征学习,最后利用有标签样本数据输入到softmax分类器,通过后向反馈微调整个网络的参数。

2.2 深度卷积网络的学习算法

2.2.1 卷积层的学习

卷积层是利用局部连接和权值共享,减少网络的自由参数个数,降低网络参数选取复杂度。在每一个卷积层中,用一个可学习的卷积核与上一层若干个特征图进行卷积,再通过一个激活函数f,如sigmoid利用式2-1就可以得到相应的输入特征。

这里l表示层数,k是卷积核,*表示二维卷积,表示偏置,是输入特征图集合。

2.2.2 下采样层的学习

下采样层利用图像局部相关性原理,对图像进行子抽样,在减少数据处理量的同时保留有用信息。这里通常是对前一层对应的特征图中的向量特征进行池化操作。池化分为平均池化和最大池化等,池化后特征图数量不变,但特征图变小,输出的特征可用式2-2计算。

其中对应权值,b表示相应偏置,dowm表示下采样函数。

深度卷积网络,输入端直接输入图像像素,采用由前向后的逐层学习方式,计算损失函数,再通过bp算法对整个训练参数进行调整。

3 深度学习中常用方法

3.1 线性校正单元

线性校正单元(ReLU)是当前最普遍使用的非线性激活函数,其函数形式为f(x)=max(x,0)。在过去神经网络通常使用Tanh或Sigmoid函数作为激活函数。研究表明,生理神经元编码可能是以稀疏分布的形式表示,因为神经元的活动电位和突出后效应消耗了绝大部分能量,同时能激活的神经元数量预测在1%至4%之间,所以大部分神经元处在静息状态。尽管ReLU非线性,并且在零点处不可微分,但是它可以生成真正的零来进行稀疏表示,所以对生理神经元激活的拟合更好。实验表明,ReLU作为激活函数,在网络中学习的更快。

3.2 Dropoup

在网络的训练过程中,过拟合是个常见的问题,尤其是在训练大规模网络的时候,Dropout 是处理这个问题的一种方法。Dropout 是指在训练的时候,以随机概率抛弃神经元的连接,进而增加网络的健壮性。若在训练中使用了 Dropout,则会导致网络连接数变少,所以测试的时候需要通过对该层的所有权值等比例缩小,以平均近似训练时的网络。神经元与Dropout 随机挑选的单元进行训练,会使得每个单元不依赖于特定单元从而变得更加健壮,进而产生有用的特征信息。

4 仿真实验

本文采用matlab仿真环境,网络采用五层结构,前两层为卷积层,卷积核分别为3和5。中间两层为全连接,最后一层是softmax分类器。实验结果如图4-1所示。结果可以看到,错误率大约为0.48%左右,此网络拥有很高的识别率。

参考文献

[1] 段宝彬,韩立新. 改进的深度卷积网络及在碎纸片拼接中的应用[J].计算机工程与应用,2014,50(9):176-181.

[2] 郑昌艳,梅卫,王刚. 基于深度卷积神经网络的蛇形机动航迹图像识别[J].火力与指挥控制,2016.05.

[3] 张宏毅. 基于深度卷e网络的同款商品图像检索研究[J].图形图像,2016.04.

[4] 刘畅. MRI脑影像的深度卷积网络分割和三维可视化[D].

[5] Glorot X, Bordes A, Bengio Y.Deep sparse rectifier neural networks;International Conferenc e on Artificial Intelligence and Statistics[C], 2011.

[6] Lennie P.The cost of cortical computation [J].Current biology,2003,13(6):493-497.

第2篇:卷积在神经网络中的作用范文

关键词: 交通标志; 识别; 卷积神经网络; 深度学习

中图分类号: TN911.73?34; TP391.41 文献标识码: A 文章编号: 1004?373X(2015)13?0101?06

Abstract: In actual traffic circumstance, the image quality of collected traffic signs is worse due to motion blur, background disturbances, weather conditions, and shooting angle. The higher requirements are proposed for accuracy, robustness and in real?time of traffic signs auto?recognition. In this situation, the traffic signs recognition method based on deep?layer convolution neural network is presented. The method adopts supervised learning model of deep?layer convolution neural network. Taking the collected traffic sign images through binarization as the inputs. The inputs are conducted multilayer process of convolution and pooling?sampling, to simulate hierarchical structure of human brain perception visual signals, and extract the characteristics of the traffic sign images automatically. Traffic signs recognition is realized by using a full connected network. The experimental results show that the method can extract the characteristics of traffic signs automatically by using deep learning ability of the convolution neural network. The method has good generalization ability and adaptive range. By using this method, the traditional artificial feature extraction is avoided, and the efficiency of traffic signs recognition is improved effectively.

Keywords: traffic sign; recognition; convolution neural network; deep learning

0 引 言

随着智能汽车的发展,道路交通标志的自动识别[1?3]作为智能汽车的基本技术之一,受到人们的高度关注。道路交通标志识别主要包括两个基本环节:首先是交通标志的检测,包括交通标志的定位、提取及必要的预处理;其次是交通标志的识别,包括交通标志的特征提取和分类。

如今,交通标志的识别方法大多数都采用人工智能技术,主要有下述两类形式[4]。一种是采用“人工特征+机器学习”的识别方法,如基于浅层神经网络、支持向量机的特征识别等。在这种方法中,主要依靠先验知识,人工设计特征,机器学习模型仅负责特征的分类或识别,因此特征设计的好坏直接影响到整个系统性能的性能,而要发现一个好的特征,则依赖于研究人员对待解决的问题的深入理解。另一种形式是近几年发展起来的深度学习模型[5],如基于限制波尔兹曼机和基于自编码器的深度学习模型以及卷积神经网络等。在这种方法中,无需构造任何的人工特征,而是直接将图像的像素作为输入,通过构建含有多个隐层的机器学习模型,模拟人脑认知的多层结构,逐层地进行信息特征抽取,最终形成更具推广性和表达力的特征,从而提升识别的准确性。

卷积神经网络作为深度学习模型之一,是一种多层的监督学习神经网络,它利用一系列的卷积层、池化层以及一个全连接输出层构建一个多层的网络,来模仿人脑感知视觉信号的逐层处理机制,以实现视觉特征信号的自动提取与识别。本文将深层卷积神经网络应用于道路交通标志的识别,通过构建一个由二维卷积和池化处理交替组成的6层网络来逐层地提取交通标志图像的特征,所形成的特征矢量由一个全连接输出层来实现特征的分类和识别。实验中将加入高斯噪声、经过位移、缩放和旋转处理的交通标志图像以及实际道路采集交通标志图像分别构成训练集和测试集,实验结果表明,本文所采用的方法具有良好的识别率和鲁棒性。

1 卷积神经网络的基本结构及原理

1.1 深度学习

神经科学研究表明,哺乳动物大脑皮层对信号的处理没有一个显示的过程[5],而是通过信号在大脑皮层复杂的层次结构中的递进传播,逐层地对信号进行提取和表述,最终达到感知世界的目的。这些研究成果促进了深度学习这一新兴研究领域的迅速发展。

深度学习[4,6?7]的目的就是试图模仿人脑感知视觉信号的机制,通过构建含有多个隐层的多层网络来逐层地对信号特征进行新的提取和空间变换,以自动学习到更加有效的特征表述,最终实现视觉功能。目前深度学习已成功地应用到语音识别、图像识别和语言处理等领域。在不同学习框架下构建的深度学习结构是不同的,如卷积神经网络就是一种深度的监督学习下的机器学习模型。

1.2 卷积神经网络的基本结构及原理

卷积神经网络受视觉系统的结构启发而产生,第一个卷积神经网络计算模型是在Fukushima的神经认知机中提出的[8],基于神经元之间的局部连接和分层组织图像转换,将有相同参数的神经元应用于前一层神经网络的不同位置,得到一种平移不变神经网络结构形式。后来,LeCun等人在该思想的基础上,用误差梯度设计并训练卷积神经网络[9?10],在一些模式识别任务上得到优越的性能。

卷积神经网络本质上是一种有监督的深度学习算法,无需事先知道输入与输出之间精确的数学表达式,只要用已知的模式对卷积神经网络加以训练,就可以学习到输入与输出之间的一种多层的非线性关系,这是非深度学习算法不能做到的。卷积神经网络的基本结构是由一系列的卷积和池化层以及一个全连接的输出层组成,可以采用梯度下降法极小化误差函数对网络中的权值和阈值参数逐层反向调节,以得到网络权值和阈值的最优解,并可以通过增加迭代次数来提高网络训练的精度。

1.2.1 前向传播

在卷积神经网络的前向传播中,输入的原始图像经过逐层的卷积和池化处理后,提取出若干特征子图并转换成一维特征矢量,最后由全连接的输出层进行分类识别。

在卷积层中,每个卷积层都可以表示为对前一层输入图像的二维卷积和非线性激励函数,其表达式可用式(1)表示:

[Ylj=f i=1Ml-1Yl-1i?Wlij+blj] (1)

式中:[Ylj]是第l层中第[j]个卷积特征子图的输出;[Ml-1]是前一层([l-1]层)的输出[Yl-1j]的总数;[Wlij]是第[l]层中第[j]个卷积的权值;[blj]是第[l]层中第[j]个卷积的阈值;符号“*”表示二维卷积运算;[f(?)]是非线性激励函数,其表达式如下:

[f(x)=11+e-x] (2)

式中:[x]是函数的输入。对于一幅[Nl-1x*Nl-1y] 的输入图像[Yl-1i]和[Klx*Kly]的卷积权值[Wlij,]输出[Ylj]的大小为[Nl-1x-Klx+1,Nl-1y-Kly+1。]

在池采样层中,每个池采样层通过一个非重叠的[kx×ky]矩形区对上一卷积层输出的特征子图进行采样(求矩形区内像素的均值或最大值)。经过池采样后输出的特征子图在两个维度上分别缩小[kx]和[ky]倍,其表达式为:

[Yl+1j=down(Ylj)] (3)

式中:[Yl+1j]表示第[l+1]层中第[j]个池采样的输出;[Ylj]是前一层(l层)的输出特征子图;down()实现对[Ylj]的池采样。图1给出了上述卷积和池采样的示意图。

在输出层中,首先利用一个全连接层将输入的特征子图转换为一个一维的特征矢量,然后再应用一个BP神经网络完成特征矢量的分类识别。BP神经网络输出层的每一个神经元的输出值对应于输入图像所属不同交通标志图像的概率,表达式为:

[Yj=fi=1nWij×Yl+1i+bj] (4)

式中:[Yj]表示输出层中第[j]个输出;[Yl+1i]是前一层([l+1]层)的输出特征(全连接的特征向量);[n]是输出特征向量的长度;[Wij]表示输出层的权值,连接输入[i]和输出[j];[bj]表示输出层第[j]个输出的阈值;[f(?)]是输出层的非线性激活函数。

对于一个有[C]种不同的交通标志和共计[N]个样本的情况,整个网络的误差平方代价函数[11]为:

[EN=12n=1Nk=1Ctnk-ynk2=12n=1NTn-Yn2] (5)

式中:[T=[t1, t2, …, tC]]为网络的理想输出目标矢量;[Y=[y1, y2, …, yC]]为网络的实际输出矢量;[tk=0,1,][yk∈[0,1],][k=1,2,…,C。]

当只考虑第[n]个单个样本时,网络的误差平方代价函数可以表示为:

[En=12k=1Ctnk-ynk2=12Tn-Yn2] (6)

1.2.2 反向传播

在反向传播过程中,卷积神经网络的训练方法采用类似于BP神经网络的梯度最速下降法,即按极小化误差的方法反向传播调整权值和阈值。网络反向传播回来的误差是每个神经元的基的灵敏度[12],也就是误差对基的变化率,即导数。下面将分别求出输出层、池采样层和卷积层的神经元的灵敏度。

(1) 输出层的灵敏度

对于误差函数式(6)来说,输出层神经元的灵敏度可表示为:

[δ=-fu×T-Y] (7)

[u=W×Yl+1+b] (8)

式中:[T]表示目标输出;[Y]表示网络的实际输出;[Yl+1]表示上一层(池采样层)的输出;[W,b]分别是输出层的权值和阈值。那么输出层的权值和阈值的导数为:

[?E?W=Yl+1×δT] (9)

[?E?b=δ] (10)

(2) 池采样层的灵敏度

池采样层没有权值和阈值,所以不存在权值和阈值的导数,只需要求出该层的灵敏度。

① 若池采样层的下一层为全连接的输出层,那么池采样层的灵敏度为:

[δl+1i=WijTδj] (11)

式中:[δil+1]表示输出层的第[j]个灵敏度;[Wij]表示输出层的权值。

② 若池采样层的下一层是卷积层,那么假设第[l+1]层为池采样层,第[l+2]层为卷积层,且卷积层的灵敏度为[δl,]有[M]个特征图。第[l+1]层中的每个特征的灵敏度等于第[l+2]层所有特征核的贡献之和,那么池采样层的灵敏度为:

[δl+1i=j=1Mδl+2j?Wl+2ij] (12)

式中:“[?]”表示卷积;[δil]表示第[l]层第[i]个特征映射的灵敏度;[δjl+1]表示第[l+1]层第[j]个特征映射的灵敏度;[Wl+1ij]表示第[l+1]层的权值,连接第[i]个特征灵敏度与第[j]个特征灵敏度。

(3) 卷积层的灵敏度

假设第[l]层为卷积层,第[l+1]层为池采样层,且池采样层的灵敏度为[δl+1,]那么卷积层的灵敏度为:

[δlj=up((δl+1j))] (13)

[up(δl+1j)δl+1j?1kx×ky] (14)

式中:up(・)表示池采样第[l+1]层的灵敏度特征映射;[δjl]表示第[l]层第[j]个特征映射的灵敏度;[δjl+1]表示第[l+1]层第[j]个特征映射的灵敏度;[kx×ky]表示采样池的大小。

现在对于一个给定的特征映射,就可以计算出卷积层的权值和阈值的导数:

[?E?Wlij=u,v(δlj)uv(Yl-1i)uv] (15)

[?E?blj=u,v(δlj)u,v] (16)

式中:[Yl-1i]是第[l-1]层与权值[Wlij]作卷积的特征映射;输出卷积映射的[(u,v)]位置的值是由第[l-1]层的[(u,v)]位置的特征映射与权值[Wlij]卷积的结果。

1.3 网络权值和阈值的调整

所有层的权值和阈值的导数都可以用上述方法求得,然后再依据梯度下降法[13]调整权值和阈值,如下:

[ΔWijk+1=ηΔWijk+α(1-η)?E?Wijk] (17)

[Wijk+1=Wijk+ΔWij(k+1)] (18)

[Δbjk+1=ηΔbjk+α(1-η)?E?bjk] (19)

[bjk+1=bjk+Δbj(k+1)] (20)

其中:[k]表示迭代次数;[ΔWij,][Δbj]分别表示权值和阈值的调整值;[Wij,][bj]分别表示权值和阈值调整后的值;[α]为学习效率;[η]为动量因子。

在前向传播过程中,得到网络的实际输出,进而求出实际输出与目标输出之间的误差;在反向传播过程中,利用误差反向传播,采用式(17)~式(20)来调整网络的权值和阈值,极小化误差;这样,前向传播和反向传播两个过程反复交替,直到达到收敛的要求为止。

2 深层卷积神经网络的交通标志识别方法

2.1 应用原理

交通标志是一种人为设计的具有特殊颜色(如红、黄、白、蓝、黑等)和特殊形状或图形的公共标志。我国的交通标志主要有警告、禁令、指示和指路等类型,一般采用颜色来区分不同的类型,用形状或图形来标示具体的信息。从交通标志设计的角度来看,属于不同类型(不同颜色)的交通标志在形状或图形上有较大的差异;属于相同类型(相同颜色)的标志中同类的指示信息标志在形状或图形上比较接近,如警告标志中的平面交叉路口标志等。因此,从机器视觉的角度来分析,同类型中同类指示信息的标志之间会比不同类型的标志之间更易引起识别错误。换句话说,相比于颜色,形状或图形是正确识别交通标志的关键因素。

因此,在应用卷积神经网络识别交通标志时,从提高算法效率和降低错误率综合考虑,将交通标志转换为灰度图像并作二值化处理后作为卷积神经网络的输入图像信息。图2给出了应用卷积神经网络识别交通标志的原理图。该网络采用了6层交替的卷积层和池采样层来逐层提取交通标志的特征,形成的特征矢量由一个全连接的输出层进行识别。图中:[W1i](i=1,2,…,m1),W1j(j=1,2,…,m2),…,[W1k](k=1,2,…,m(n?1))分别表示卷积层[L1,L3,…,Ln-1]的卷积核;Input表示输入的交通标志图像;Pool表示每个池采样层的采样池;map表示逐层提取的特征子图;[Y]是最终的全连接输出。

交通标志识别的判别准则为:对于输入交通标志图像Input,网络的输出矢量[Y=[y1,y2,…,yC],]有[yj=Max{y1,][y2,…,yC},]则[Input∈j,]即判定输入的交通标志图像Input为第[j]类交通标志。

2.2 交通标志识别的基本步骤

深层神经网络识别交通标志主要包括交通标志的训练与识别,所以将交通标志识别归纳为以下4个步骤:

(1) 图像预处理:利用公式Gray=[0.299R+][0.587G+0.114B]将彩色交通标志图像转换为灰度图像,再利用邻近插值法将交通标志图像规格化,最后利用最大类间方差将交通标志图像二值化。

(2) 网络权值和阈值的初始化:利用随机分布函数将权值[W]初始化为-1~1之间的随机数;而将阈值[b]初始化为0。

(3) 网络的训练:利用经过预处理的交通标志图像构成训练集,对卷积神经网络进行训练,通过网络前向传播和反向传播的反复交替处理,直到满足识别收敛条件或达到要求的训练次数为止。

(4) 交通标志的识别:将实际采集的交通标志图像经过预处理后,送入训练好的卷积神经网络中进行交通标志特征的提取,然后通过一个全连接的网络进行特征分类与识别,得到识别结果。

3 实验结果与分析

实验主要选取了我国道路交通标志的警告标志、指示标志和禁令标志三类中较常见的50幅图像。考虑到在实际道路中采集到的交通标志图像会含有噪声和出现几何失真以及背景干扰等现象,因此在构造网络训练集时,除了理想的交通标志以外,还增加了加入高斯噪声、经过位移、旋转和缩放处理和实际采集到的交通标志图像,因此最终的训练样本为72个。其中,加入的高斯噪声为均值为0,方差分别为0.1,0.2,0.3,图像的位移、旋转、缩放的参数分别随机的分布在±10,±5°,0.9~1.1的范围内。图3给出了训练集中的交通标志图像的示例。图4是在实际道路中采集的交通标志图像构成的测试集的示例。

在实验中构造了一个输入为48×48个神经元、输出为50个神经元的9层网络。网络的输入是像素为[48×48]的规格化的交通标志图像,输出对应于上述的50种交通标志的判别结果。网络的激活函数采用S型函数,如式(2)所示,其输出范围限制在0~1之间。

表1给出网络的结构参数,包括每一层的特征数、神经元数、卷积核尺寸和均值采样尺寸等。

图5给出一幅交通标志图像在卷积层和均值采样层的特征子图的示例。

图6是交通标志的训练总误差[EN]曲线。在训练开始的1 500次,误差能迅速地下降,在迭代2 000次以后是一个平稳的收敛过程,当迭代到10万次时,总误差[EN]可以达到0.188 2。

在交通标志的测试实验中,为了全面检验卷积神经网络的识别性能,分别针对理想的交通标志,加入高斯噪声、经过位移、旋转和比例缩放以及采集的交通标志图像进行实验,将以上测试样本分别送入到网络中识别,表2给出了测试实验结果。

综合分析上述实验结果,可以得到以下结论:

(1) 在卷积神经网络的训练学习过程中,整个网络的误差曲线快速平稳的下降,体现出卷积神经网络的训练学习具有良好的收敛性。

(2) 经逐层卷积和池采样所提取的特征具有比例缩放和旋转不变性,因此对于旋转和比例缩放后的交通标志能达到100%的识别率。

(3) 与传统的BP网络识别方法[11]相比较,卷积神经网络能够达到更深的学习深度,即在交通标志识别时能够得到更高的所属类别概率(更接近于1),识别效果更好。

(4) 卷积神经网络对实际采集的交通标志图像的识别率尚不能达到令人满意的结果,主要原因是实际道路中采集的交通标志图像中存在着较严重的背景干扰,解决的办法是增加实际采集的交通标志训练样本数,通过网络的深度学习,提高网络的识别率和鲁棒性。

4 结 论

本文将深层卷积神经网络应用于道路交通标志的识别,利用卷积神经网络的深层结构来模仿人脑感知视觉信号的机制,自动地提取交通标志图像的视觉特征并进行分类识别。实验表明,应用深层卷积神经网络识别交通标志取得了良好的识别效果。

在具体实现中,从我国交通标志的设计特点考虑,本文将经过预处理二值化的图像作为网络的输入,主要是利用了交通标志的形状信息,而基本略去了颜色信息,其优点是在保证识别率的基础上,可以简化网络的结构,降低网络的计算量。在实际道路交通标志识别中,将形状信息和颜色信息相结合,以进一步提高识别率和对道路环境的鲁棒性,是值得进一步研究的内容。此外,本文的研究没有涉及到道路交通标志的动态检测,这也是今后可以进一步研究的内容。

参考文献

[1] 刘平华,李建民,胡晓林,等.动态场景下的交通标识检测与识别研究进展[J].中国图象图形学报,2013,18(5):493?503.

[2] SAHA S K, DULAL C M, BHUIYAN A A. Neural network based sign recognition [J]. International Journal of Computer Application, 2012, 50(10): 35?41.

[3] STALLKAMP J, SCHLIOSING M, SALMENA J, et al. Man vs. computer: benchmarking machine learning algorithms for traffic sign recognition [J]. Neural Network, 2012, 32(2): 323?332.

[4] 中国计算机学会.深度学习:推进人工智能梦想[EB/OL].[2013?06?10].http://.cn.

[5] 郑胤,陈权崎,章毓晋.深度学习及其在目标和行为识别中的新进展[J].中国图象图形学报,2014,19(2):175?184.

[6] FUKUSHIMA K. Neocognition: a self?organizing neural network model for a mechanism of pattern recognition unaffected by shift in position [J]. Biological Cybernetics, 1980, 36(4):193?202.

[7] LECUN Y, BOTTOU L, BENGIO Y, et al. Gradient?based learning applied to document recognition [J]. IEEE Journal and Magazines, 1989, 86(11): 2278?2324.

[8] LECUN Y, BOTTOU L, BENGIO Y, et al. Backpropagation applied to handwritten zip code recognition [J]. Neural Computation, 1989, 1(4) : 541?551.

[9] CIRESAN D, MEIER U, MASCI J, et al. Multi?column deep neural network for traffic sign classification [J]. Neural Networks, 2012, 32(2): 333?338.

[10] NAGI J, DUCATELLE F, CARO D, et al. Max?pooling convolution neural network for vision?based hand gesture recognition [C]// 2011 IEEE International Conference on Signal and Image Processing Application. Kuala Lumpur: IEEE, 2011, 342?347.

[11] 杨斐,王坤明,马欣,等.应用BP神经网络分类器识别交通标志[J].计算机工程,2003,29(10):120?121.

[12] BUVRIE J. Notes on convolutional neural networks [EB/OL]. [2006?11?12]. http:///5869/.

[13] 周开利,康耀红.神经网络模型及其Matlab仿真设计[M].北京:清华大学出版社,2005.

第3篇:卷积在神经网络中的作用范文

【关键词】视频 行为识别 检测

近年来,各种视频监控越来越深入我们的生活中。因其实时性、直观性以及设备成本日益降低在各行各业中而倍受青睐。但视频监控系统还是依靠人工来控制,没有进入数字化的全天实时监测、智能分析图像数据。要实现完全数字化的监控的关键在于人体行为的智能识别。

早些时候有人提出并且应用了智能图像识别的卷积神经网络,它是在原始的输入中应用可训练的滤波器和局部邻域池化操作,来得到一个分级的且逐渐复杂的特征表示。实践表示,采用合适的规则化项来训练,它可以达到非常好的效果。比较好的地方是对姿势、光照和复杂背景存在不变性,单只受限在2D输入的舞台。本文文章提出了一个新的3D卷积神经网络模型,用于运动识别。该模型可以从空间和时间的维度提取特征,然后进行3D卷积,以捕捉从多个连续帧得到的运动信息。为了有效的综合运动信息,文中通过在卷积神经网络的卷积层进行3D卷积,以捕捉空间上、时间上的维度,让其都具有区分性的特征。

3D卷积是通过堆叠多个连续的帧组成一个立方体,然后在立方体中运用3D卷积核。在其中,卷积层中每一个特征map都会与上一层中多个邻近的连续帧相连,以捕捉运动信息。一个卷积map的某一位置的值是通过卷积上一层的三个连续的帧的同一个位置的局部感受得到的。要强调的是:3D卷积核只能从cube中提取一种类型的特征,因为在整个cube中卷积核的权值都是一样的,也就是共享权值,都是同一个卷积核。可以采用多种卷积核,以提取多种特征。有一个通用的设计规则就是:在后面的层(离输出层近的)特征map的个数应该增加,这样就可以从低级的特征maps组合产生更多类型的特征。本文中的3D 卷积神经网络架构包含一个硬连线hardwired层、3个卷积层、2个下采样层和一个全连接层。每个3D卷积核卷积的立方体是连续7帧,每帧patch大小是60x40。

在第一层,应用了一个固定的hardwired的核去对原始的帧进行处理,产生多个通道的信息,然后对多个通道分别处理。最后再将所有通道的信息组合起来得到最终的特征描述。这个实线层实际上是编码对特征的先验知识,这比随机初始化性能要好。

每帧提取五个通道的信息,分别是:灰度、x和y方向的梯度,x和y方向的光流。其中,前面三个都可以每帧都计算。然后水平和垂直方向的光流场需要两个连续帧才确定。所以是7x3 + (7-1)x2=33个特征maps。然后用一个7x7x3的3D卷积核(7x7在空间,3是时间维)在五个通道的每一个通道分别进行卷积。为了增加特征map的个数(实际上就是提取不同的特征),在每一个位置都采用两个不同的卷积核,这样在C2层的两个特征maps组中,每组都包含23个特征maps。23是(7-3+1)x3+(6-3+1)x2前面那个是:七个连续帧,其灰度、x和y方向的梯度这三个通道都分别有7帧,然后水平和垂直方向的光流场都只有6帧。54x34是(60-7+1)x(40-7+1)。

在紧接着的下采样层S3层max pooling,在C2层的特征maps中用2x2窗口进行下采样,这样就会得到相同数目但是空间分辨率降低的特征maps。下采样后,就是27x17=(52/2)*(34/2)。 C4是在5个通道中分别采用7x6x3的3D卷积核。为了增加特征maps个数,在每个位置都采用3个不同的卷积核,这样就可以得到6组不同的特征maps,每组有13个特征maps。13是((7-3+1)-3+1)x3+((6-3+1)-3+1)x2前面那个是:七个连续帧,其灰度、x和y方向的梯度这三个通道都分别有7帧,然后水平和垂直方向的光流场都只有6帧。21x12是(27-7+1)x(17-6+1)。

S5层用的是3x3的下采样窗口,所以得到7x4. 到这个阶段,时间维上帧的个数已经很小了。在这一层,只在空间维度上面卷积,这时候使用的核是7x4,然后输出的特征maps就被减小到1x1的大小。而C6层就包含有128个特征map,每个特征map与S5层中所有78(13x6)个特征maps全连接,这样每个特征map就是1x1,也就是一个值了,而这个就是最终的特征向量了。

经过多层的卷积和下采样后,每连续7帧的输入图像都被转化为一个128维的特征向量,这个特征向量捕捉了输入帧的运动信息。输出层的节点数与行为的类型数目一致,而且每个节点与C6中这128个节点是全连接的。采用一个线性分类器来对这128维的特征向量进行分类,实现行为识别。模型中所有可训练的参数都是随机初始化的,然后通过在线BP算法进行训练。

3D 卷积神经网络模型的输入被限制为一个少的连续视频帧,因为随着输入窗口大小的增加,模型需要训练的参数也会增加。当然有些人的行为是跨越很多帧的,所以在3D 卷积神经网络模型中,有必要捕捉这种高层的运动信息。需要用大量的帧来计算运动特征,然后把这些运动特征作为辅助输出去规则化3D 卷积神经网络模型。

对于每一个需要训练的行为,提取其长时间的行为信息,作为其高级行为特征。这个运动信息因为时间够长,所以要比卷积神经网络的输入帧的立方体包含的信息要丰富很多。然后我们就迫使卷积神经网络学习一个非常接近这个特征的特征向量。这可以通过在卷积神经网络的最后一个隐层再连接一系列的辅助输出节点,然后训练过程中,使提取的特征更好的逼近这个计算好的高层的行为运动特征向量。

试验中,在原始的灰度图像中计算稠密sift描述子,然后通过这些sift描述子和运动边缘历史图像(MEHI)组合构造bag-of-words特征作为辅助特征。 因为灰度图保留了外观信息,运动边缘历史图像只关心形状和运动模式,所以可以提取这两个互补的信息作为两个连续帧的局部特征bag。先简单的计算两帧间的差分,这样就可以保留运动信息,然后对其执行一次Canny边缘检测,这样可以使得观测图像更加清楚简洁。最总的运动边缘图像就是将历史的这些图像乘以一个遗忘因子再累加起来得到。

本文中,构造不同的3D 卷积神经网络模型,它可以从输入捕捉潜在的互补信息,然后在预测阶段,每个模型都针对一个输入得到对应的输出,然后再组合这些输出得到最终的结果。

作者简介:

第4篇:卷积在神经网络中的作用范文

关键词:无人机;STM32;道路检测;神经网络;模型训练

传统的道路巡检和保养主要由人工来完成,需要投入大量的人力物力来保证道路的相对安全,这种方式存在着低效率、高成本且难以保证道路的决定安全[1]。固定式交通检测设备大量设置在道路的主干路上,也存在着一些缺陷:(1)监控摄像头不能做到全覆盖且具有一定的探测盲区。(2)监控系统采用多屏幕方式,工作人员进行道路故障判断时受限。(3)不能灵活的通知有关部门对事故的快速应急处理。为了克服上述的缺点,本文设计了一种基于卷积神经网络的无人机道路巡检系统,对发生故障和需要保养的道路能快速响应,及时的通知有关部门,避免事故的发生。

1系统的总体设计

在无人机道路巡检系统中,我们主要考虑了以下几个要求[3]:(1)无人机系统能满足正常的工作;(2)无人机系统能适应各种天气和气候变化等;(3)无人机系统应充分考虑控制的安全性;(4)视频流的传输应避免较长的延时。无人机道路巡检系统主要由无人机系统设计、远程控制系统、PC端系统三大部分组成,系统的总体结构框图如图1所示。系统的具体工作原理为:无人机将道路环境检测的结果,将处理后的视频流通过远程传输的方式,发送到PC端进行实时监控道路状况。远程控制系统以STM32作为主控芯片,主要包括在无人机端和遥控端两个部分,遥控端将控制指令通过2.4G通信发送到无人机端,此时无人机的做出相应的位姿变化,完成遥控端对无人机位姿的控制。无人机系统的图像采集模块芯片为树莓派,完成图像的采集并采用TCP通信实现远程视频的传输,将获取的视频流传输到PC端。PC端上使用OpenCV对图像进行处理[4],利用深度学习模块对设计的神经网络进行数据训练,从而得到检测模型,最后在PC上接收处理过的数据并实时监测道路状况。上述工作原理可实现无人机道路巡检系统,下文将对其包括的三大模块进行说明介绍。

2无人机系统设计

本次使用的是RaspberryPi3(modelB+)作为无人机的主控制板[7],无人机的飞行控制算法和图像采集模块集成在树莓派中。远程控制系统通过2.4G无线通信模块连接,通过控制器实现对无人机飞行和图像采集的控制。无人机系统总体结构如图2所示。

3PC端系统设计

在PC端系统设计主要分为图像预处理、模型训练和视频监控三大部分,通过TCP通信协议进行通信,TCP通信是一种面向连接的通信,可完成客户端(树莓派)和服务端(PC)的信息传递[9]。下面主要对前两部分详细介绍。

3.1图像预处理

本系统对地面裂缝检测的图像预处理流程如图3所示具体工作原理为:(1)采用加权平均灰度化对获取的无人机影像进行灰度化处理;(2)对灰度化处理后的影像进行直方图均衡化,使得影像具有高对比度和多元的灰度色调变化,为后续的滤波降噪奠定基础;(3)对处理后的影像进行滤波降噪,消除孤立的噪声点,采用方法的是中值滤波降噪;(4)使用迭代二值化处理将影像的灰度值设置合适的阈值,使得图像更简单,目标更突出,然后对图像进行分割,计算迭代的阈值,判断迭代的阈值是否收敛到某一值或者达到限定的迭代次数,如果是的话,将完成二值化处理和滤波,否则将初始二值化阈值;(5)最终完成道路故障的识别与标记。

3.2模型检测

3.2.1卷积神经网络原理使用卷积神经网络进行模型训练,首先使用卷积层实现特征的提取,原理如图4所示。如图5所示,卷积操作是模仿神经元的机制。不同的输入在权重的影响下会有不同的输出,根据损失函数的计算来不断的更新权重,直到获得合理的权重参数。初始传递的信号为x,中间通过权重w,再经过偏置b后连接在末端,最后输出信号变成wx+b。fun(•)表示激活函数,最终f(z为输出的结果,如式(1)所示。3.2.2卷积神经网络训练流程通过相机采集到的缺陷和问题图像作为训练样本,这部分是检测道路安全的关键一步,(1)训练标记数据:首先使用图像预处理中标记好的道路故障提取出来,通过卷积神经网络对标记框内的目标数据进行训练;(2)提取特征数据:将道路故障的类型统计并归纳;(3)误差反馈学习:对测试样本进行误差反馈学习,并进行测试;(4)优化训练数据:根据实际应用场景增加图像的种类和数量,不断训练模型。3.2.3故障的基本分类道路故障主要路面缺陷(例如裂缝、残缺等)和路面增加(例如长时间静止的车辆和路人),各自训练集数量为1000张。如表1所示。3.2.4实验测试为实现故障的检测,测试数据集为100张,不同类型故障数据50张,均采集自新道路且与训练样本一致,实验结果如表2所示。由表2可知,检测路面增加(例如长时间静止的车辆和路人)的准确率高达96%,但是地面缺陷的准确率相比较而言略低,可能造成的原因是:①硬件原因导致采集的图像清晰度比较低;②地面缺陷太小,无人机难以识别;③训练的数据集较少,特征学习误差大;但是满足了设计需求,还需进一步改进。

4总结与展望

第5篇:卷积在神经网络中的作用范文

关键词:卷积神经网络;深度学习;年龄分类

0引言

人脸作为人类个体鲜明显著的生物特征之一,包含着丰富的个人信息。随着计算机视觉和机器学习技术的发展,相关的人脸识别等技术已成为这些项目任务的热点课题,并在法医、电子化客户关系管理、安防、生物识别和娱乐影音等诸多领域中得到广泛应用。人脸除了可进行身份认证和识别外,还可以提取出性别、种族和年龄等信息,特别是可以将年龄及分布特征用于人机交互和商业智能等应用中,因此年龄估计研究具有重要的科学意义和实用价值。

相对于人脸识别,人脸所能表征的年龄信息要受到很多因素的影响,例如不同个体的基因差异、生活习惯、环境、抗压能力、健康情况和种族差别等有很大的关系。同时,相同个体因发型、化妆和表情的不同也会影响年龄的估计。因此,如果要基于传统的分类算法(如支持向量机)并利用人脸图像信息来进行年龄分类将很难得到理想的结果。针对这些问题,目前的研究还相对不足,如果能有效解决上述问题,对大部分潜在的应用领域也都将带来深刻的影响。

1相关工作

年龄分类的主要流程是先根据人脸图像获取特征,再通过机器学习方法构建模型,通过把年龄分为多个年龄区段,即每个年龄段对应一个类别(比如未成年或成年人等)。因此可以把年龄分类看成是一个二分类或者多分类的分类问题来进行求解。1994年,Kwon和Lobo则从人脸图像中获取年龄分类,把人分为3种不同的类别,也就是儿童、青年人和老年人,强调重要特征点的选择。2002年Lanitis等人提出了能自动对年龄实现估计的年龄量化方法。而且,王先梅等的综述中也整体梳理了相关年龄估计技术的研究发展。王绍宇等人还基于SMV采用生物特征对人进行分类,分为小孩和成人。此外在2016年,董远等人更将迁移学习和卷积神经网络用于人的年龄和性别分类。

第6篇:卷积在神经网络中的作用范文

关键词:ROS;表面缺陷;图像采集;神经网络;模型训练

飞机蒙皮是包围在飞机骨架结构外且用粘接剂或铆钉固定于骨架上,形成飞机气动力外形的维形构件,在飞机正常工作状态下扮演着重要的角色,一旦飞机蒙皮出现缺陷等问题,需要及时的反馈出来并且维修。传统的飞机表面缺陷检测方式大多数是由人工来完成,会存在效率低、成本高等缺点,甚至会出现检测失误的情况。本文就针对铝合金表面缺陷检测方面,提出一种基于ROS的飞机表面缺陷检测系统,采用移动机器人底盘定位和导航技术,结合深度学习、图像处理等技术检测出存在缺陷的位置并标记出来,通过机器代替传统人工的方式,旨在提高检测效率和检测精度,为飞机表面缺陷检测提供一种方式。

1系统的总体设计

飞机表面缺陷检测系统主要由检测模块、ROS机器人模块、图像处理模块三大部分组成,系统的总体结构框图如图1所示。系统的具体工作原理为:在某一区域范围内,检测模块以树莓派为核心控制器,通过检测模块中的图像采集系统对铝合金材料表面进行图像采集,将采集到的图像通过TCP通信传输到图像处理模块上[4]。图像处理模块利用深度学习中设计的卷积神经网络进行数据训练,得到检测模型,将检测模型应用到图像预处理上。此时,OpenCV对检测模块得到的图像进行图像处理[5],最终得到缺陷出现的位置。当前区域检测完毕后,通过ROS机器人模块的定位和导航功能,驱动运动执行机构工作,并移动到相邻下一块检测区域,直到所有位置都检测完毕。上述工作原理可实现飞机表面缺陷检测系统,下文将对其包括的三大模块进行说明介绍。

2检测模块设计

如图2所示,系统的检测模块主要是包括树莓派和摄像头,其中树莓派作为检测模块的处理器,搭建的有Ubuntu系统,是系统实现的重要组成部分。树莓派可以提供普通计算机的功能,并且功耗低。可直接在树莓派上安装Keil进行开发,具有很好的开发效果,运行稳定。本次飞机表面缺陷检测系统实现了树莓派将摄像头拍摄的图片发送到图像处理模块上,同时也搭载ROS系统实现了移动底盘的定位和导航功能。

3ROS机器人模块设计

ROS随着机器人技术发展愈发受到关注,采用分布式框架结构来处理文件,这种方式允许开发者单独设计和开发可执行文件。ROS还以功能包的形式封装功能模块,方便移植和用户之间的共享。下面将介绍其建图和导航功能的实现。

3.1建图设计

本文在ROS系统中使用Gmapping算法软件包实现建图[7],在ROS系统中设计了建图过程中各节点及节点间的话题订阅/的关系如图3所示。在图3建图节点话题关系图上,其中椭圆形里代表节点,矩形基于ROS的飞机表面缺陷检测系统胡浩鹏(纽约大学NewYorkUniversity纽约10003)框里代表的是主题,节点指向主题代表着该节点了主题消息,主题指向节点代表着该节点订阅了主题消息。在建图过程中,主要涉及激光雷达节点、键盘控制节点、底盘节点、Gmapping节点和地图服务节点。

3.2导航设计

ROS提供的Navigation导航框架结构如图4所示,显然MOVE_BASE导航功能包中包括全局路径规划和局部路径规划两部分,即在已构建好的地图的基础上,通过配置全局和局部代价地图,从而支持和引导路径规划的实施。为了保证导航效果的准确,通过AMCL定位功能包进行护理床的位置定位[8]。获取目标点的位置后,MOVE_BASE功能包结合传感器信息,在路径规划的作用下,控制指令,控制护理床完成相应的运动。

4图像处理模块设计

图像处理模块设计主要分为图像预处理、模型训练和卷积神经网络三大部分,通过TCP通信协议进行通信,TCP通信是一种面向连接的通信,可完成客户端(树莓派)和服务端(PC)的信息传递[9]。下面主要对卷积神经网络部分进行介绍。

4.1卷积神经网络训练流程

通过相机采集到的缺陷和问题图像作为训练样本,这部分是检测飞机表面缺陷的关键一步,然后对训练样本进行训练,具体步骤如下所示。(1)训练标记数据:首先使用图像预处理中标记好的道路故障提取出来,通过卷积神经网络对标记框内的目标数据进行训练;(2)提取特征数据:将道路故障的类型统计并归纳;(3)误差反馈学习:对测试样本进行误差反馈学习,并进行测试;(4)优化训练数据:将得到的测试结果与设定的故障分类结果进行误差对比,不断优化训练集,最终得到理想的训练数据。

4.2缺陷检测流程

缺陷检测流程如图5所示,首先输入缺陷原始图像,通过特征提取网络,将处理后的图像使用检测器进行检测,其中检测器里为卷积神经网络训练后得到的模型,最终缺陷检测后得到的识别后的图像,并反馈出来。

4.3实验测试

铝合金表面缺陷主要有碰伤、刮花、凸粉、脏点等常见的缺陷,下面将以这四种为主要对象进行检测训练,各自训练集数量为1000张。通过卷积神经网络对缺陷的特征进行提取和分类,最终实现了缺陷的检测。本次实验测试的样本为200张,每种缺陷50张,均采集自铝合金材料表面且与训练样本一致,实验结果如表1所示。由表1可知,检测脏点的准确率高达98%,刮花和凸粉的准确率也达到94%,但碰伤的准确率相对较低,只有88%。可能造成的原因是:①硬件原因导致采集的图像清晰度比较低;②碰伤缺陷不明显,无人机难以识别;③训练的数据集较少,特征学习误差大;但最后结果是满足了设计需求,还需进一步改进。

5总结与展望

第7篇:卷积在神经网络中的作用范文

关键词: 超分辨率; 深度学习; 卷积; 神经网络; 视觉特征; 映射

中图分类号:TP399 文献标志码:A 文章编号:1006-8228(2017)07-38-04

Application of deep learning in super-resolution image reconstruction

Han Sensen

(School of Computer and Information Engineering, Henan University, Kaifeng, Henan 475000, China)

Abstract: Super-resolution image reconstruction can reconstruct a high-resolution image using low-resolution images; it has become a hotspot in image processing. Deep learning is a popular branch of machine learning, which by combining low-level features to form more abstract high-level visual features, to avoid the artificial extraction of features. This paper divides the current reconstruction algorithm into three categories, which are based on interpolation, based on reconstruction and based on learning, and especially focuses on the reconstruction algorithms based on deep learning. Finally the future research direction of super-resolution image reconstruction technology is prospected.

Key words: super-resolution; deep learning; convolution; neural networks; visual feature; mapping

0 引言

单帧图像的超分辨率(super resolution,SR)重建是指利用已知的低分辨率图像,重构出具有更高像素密度的图像,并且重构出的图像还能够保持丰富的纹理、质地等细节信息。它在视频监控、图像打印、医学图像处理、卫星成像等领域有较广泛的应用。

超分辨率图像的重建本质上是一个病态(ill-posed)问题,因为不完全相同的多张图像高分辨图像在经过相同的降采样都可以产生相同的低分辨图像,这是一种典型的一对多问题,因此存在惟一解,特别是在放大倍数较高的情况下该问题将变得更为复杂。

1 算法分类

当前的超分辨算法大致可分为三类:基于插值的超分辨率重建算法,基于重构的超分辨率重建算法和基于学习的超分辨率重建算法。

基于插值的重建算法假设像素的灰度值是连续变化的,并利用邻近像素的灰度值计算待插值像素的灰度值,然而实际应用中许多图像并不满足这种假设。并且该算法通过一个预定义的数学公式直接将低分辨率图像生成高分辨率的图像而不考虑任何的图像特性,也不接受任何的训练。所以基于差值方法得到的重建图像容易产生模糊、锯齿现象。常见的线性插值方法有最近邻插值方法,双线性插值方法,双三次插值方法等。

基于重构的超分辨率重建算法是依照特定的退化模型,将已知的低分辨率图像序列中不同鼍暗男畔⒔行融合来重建出高分辨率图像,因此该算法需要对图像进行配准。常见重构算法有种迭代反向投影[1](IBP)、凸集投影法[2](POCS)。

基于学习的分辨率重建算法则是通过机器学习方法从大量的低分辨图像和高分辨图像对中学习它们之间的映射函数,利用学习到的函数对测试图像进行预测来产生高分辨率图像。常见的基于学习的分辨率重建算法有嵌套的邻域嵌入[3](Neighbor Embedding with Locally Linear Embedding)、固定邻域回归[4](Anchored Neighborhood Regression)、稀疏编码[5](Sparse Coding)。

相比较于其他两类算法而言,基于学习的SR算法直接学习分辨率图像与高分辨率图像端到端的映射函数,比传统的插值和重构的方法具有更突出的性能。本文着重介绍几种基于深度学习的超分辨算法,包括SRCNN[6],DRCN[7], ESPCN[8]和SRGAN[9]等。

2 SRCNN

SRCNN(Super-Resolution Convolutional Neural Network)是较早地使用卷积神经网络来做SR的网络模型。该网络结构十分简单,仅仅用了三个卷积层。对于一张低分辨率图像,SRCNN首先使用双三次插值将它放大到将要放大的尺寸,再通过三层卷积神经网络做非线性映射,得到的输出结果作为重建的高分辨率图像。整个过程可分为三个部分:图像块的提取和特征表示,特征非线性映射和最终的重建。

图像块提取与表示:该过程从低分辨率图像中提取出部分重叠的图像块,并将每个图像块表示为一个高维向量,这些向量包含一些特征映射,映射的个数与向量的维数相同。

非线性映射:这个功能将每个高维向量非线性地映射成另外一个高维向量。从概念上来讲每个映射后的向量代表了一个高分辨率图像块。这些向量构成了另外一个特征集。

重建:这个处理聚集以上高分辨率基于像素块的替代对象,用于生成最终的高分辨率图像。并且我们希望这个图像能尽可能与高分辨率原图相近。

对重建后的超分辨率图像的质量进行定量评价的两个常用指标是PSNR[10](Peak Signal-to-Noise Ratio)和SSIM[11](Structure Similarity Index)。这两个值代表重建图像的像素值和原始图像像素值的接近程度,具体对比结果如表1,在2、3、4的放大倍数下,SRCNN与传统方法的对比,可以看出无论是在哪个放大倍数下,SRCNN的PSNR值都比其他的重建算法要高出0.4Db左右。

SRCNN的网络层数较少,同时局部感受野也较小,所以从输入图像中提取到的信息就非常有限。因此DRCN(Deeply-Recursive Convolutional Network for Image Super-Resolution)提出在网络中增加更多的卷积层增加局部感受野的大小,这样可利用更多的邻域像素。同时为了避免过多W络参数,DRCN提出使用递归神经网络RNN(Recurrent neural network)。

与SRCNN比较类似DRCN的网络结构可分为三个部分,第一个是Embedding network,相当于SRCNN中的特征提取,第二个是Inference network,相当于SRCNN中的非线性变换,第三个是Reconstruction network,即从特征图像得到最后的重建结果。其中的Inference network是一个递归网络,即数据循环地通过该层进行多次递归。将这个递归过程展开后可以看出,它等效于多个串联的卷积层共享同一组参数,Inference network展开后的网络结构是由D个共享参数的卷积层组成。DRCN将每一层的卷积输出都送入同一个Reconstruction Net来作为其输入,由于递归的深度是D,从而一共可得到D个重建图像,再把它们加权平均得到最终的输出。此外DRCN受ResNet[14]的启发通过skip connection将输入图像与Inference net的输出HD叠加作为Reconstruction Net的输入,这就相当于Inference Net学习的是高分辨率图像与低分辨率图像的残差图像,即图像的高频信息。

实验部分,DRCN同样也使用了包含91张图像的Set91[4]数据集进行训练,与SRCNN不同的是DRCN使用的训练数据是在多个方法倍数下生成的,而不像SRCNN那样在单一的放大倍数下生成,这样可以利用不同尺度图像间的信息进行互补,理论上DRCN的重建效果会由于SRCNN,具体的对比结果如表2所示,可以看出DRCN的重建图像的PSNR与SRCNN相比有了较大提高。

4 ESPCN

在SRCNN和DRCN中,低分辨率图像都需要先使用双三次插值得到与高分辨率图像大小相同的低分辨率图像来为网络输入,这意味着卷积的计算将在较高分辨率的图像上进行,这与在低分辨率图像上计算卷积相比于会需要较大的计算开销。因此ESPCN(Real-Time Single Image and Video Super-Resolution Using an Efficient Sub-Pixel Convolutional Neural Network)提出在低分辨率图像上直接计算卷积来得到高分辨率图像。

ESPCN的核心思想是亚像素卷积层(Sub-pixel Convolutional Layer)。网络的输入是原始的低分辨率图像,经过两个卷积层后得到的特征图像大小与输入图像一样,但是特征的通道数变为r2,γ是图像的目标放大倍数。然后将每个像素上的r2个通道重新排列成一个γ×γ的区域,该区域对应于高分辨率图像中的一个区域大小为γ×γ的子块,从而对于一个大小为r2×H×W的特征图像在通道上进行重新排列会形成一个大小为1×rH×rW的图像,该图像的尺寸是输入图像尺寸的r倍,从而间接地实现了输入图像的放大。

通过使用sub-pixel convolution可以间接的实现图像的放大过程,即插值函数是隐含地包含在前面的卷积层中,只在网络的最后一层对图像大小做变换,前面的卷积运算由于在低分辨率图像上进行,因此效率会有很明显的较高。

ESPCN的训练与SRCNN类似,在重建效果上,以PSNR为评价指标来看ESPCN比SRCNN有进一步的提高,具体对比如表3所示。而时间效率方面对于一个1080HD的视频图像,对其放大四倍进行的高分辨率重建,SRCNN需要的时间为0.434s,而ESPCN只需要0.029s。

SRGAN(Photo-Realistic Single Image Super Resolution Using a Generative Adversarial Network)是将生成对抗网络用于SR问题的处理。其出发点是传统的方法一般只能处理的是较小的放大倍数,当图像的放大倍数在4以上时,得到的结果往往显得过于平滑,从而重建出的图像在视觉上却少一些质地细节的真实感,因此SRGAN使用GAN来生成图像中的细节。

SRGAN网络由两部分组成:生成网和判别网,生成网用于生成一些图像,判别网用于判断接收到的输入图像是由生成网生成的还是来自于真实样本中的原始图像。训练时如果判别网无法区分出来输入的样本来自于哪里就达到了预期的效果。

传统方法一般使用图像的最小均方差(MSE)作为误差函数,即该误差函数使重建图像有较高的PSNR,但是重建图像缺少了必要的高频信息,因而在重建后的图像中容易出现过度平滑的纹理。在SRGAN的误差函数中又增加了一个内容误差项和生成误差项。

内容误差用于衡量重建出图像与原始图像在更高级的视觉特征上的差e。其具体定义由以下公式描述。

生成误差项基于判别网输出的概率,其输出值表示输入数据来自于真实样本的概率大小。其具体定义由以下公式描述。

其中是一个图像属于真实的高分辨率图像的概率。是重建的高分辨率图像。

SRGAN的训练过程与前面的网络类似,同样使用PSNR和SSIM评价标准对算法的重建效果进行测试,SRGAN生成的高分辨率图像看起来更真实,具体的对比如表4所示。

6 结束语

深度学习已经在超分辨率图像重建领域取得了突破性的成绩,同时它仍然存在一些问题,例如它与传统的机器学习方法一样,通常假设训练数据与测试数据服从同样的分布,而实际上这两者存在一定的偏差。此外当前的重建算法仍然只使用于较小的放大倍数,对于较大的放大倍数得到重建图像仍然过于平滑模糊,因此如何充分利用深度学习来增强算法在较高的放大倍数下的重建性能是目前深度学习研究的重点。

参考文献(References):

[1] Irani M, Peleg S. Improving resolution by image registration[J].

CVGIP: Graphical models and image processing,1991.53(3):231-239

[2] Stark H, Oskoui P. High-resolution image recovery from

image-plane arrays, using convex projections[J].JOSA A,1989.6(11):1715-1726

[3] Timofte R, De Smet V, Van Gool L. A+: Adjusted

anchored neighborhood regression for fast super-

resolution[C],2014:111-126

[4] Timofte R, De Smet V, Van Gool L. Anchored

neighborhood regression for fast example-based super-

resolution[C],2013:1920-1927

[5] Yang J, Wright J, Huang T S, et al. Image

super-resolution via sparse representation[J]. IEEE transactions on image processing,2010.19(11):2861-2873

[6] Bruna J, Sprechmann P, Lecun Y, et al. Image

Super-Resolution Using Deep Convolutional Networks[J]. Computer Science,2015.

[7] Kim J, Lee J K, Lee K M. Deeply-Recursive Convolutional

Network for Image Super-Resolution[J]. arXiv preprint arXiv:1511.04491,2015.

[8] Shi W, Caballero J, Huszár F, et al. Real-Time Single

Image and Video Super-Resolution Using an Efficient Sub-Pixel Convolutional Neural Network[J],2016.

[9] Ledig C, Theis L, Huszar F, et al. Photo-Realistic Single

Image Super-Resolution Using a Generative Adversarial Network[J],2016.

[10] Hore A, Ziou D. Image Quality Metrics: PSNR vs. SSIM[J],

2010:2366-2369

[11] Wang Z, Bovik A C, Sheikh H R, et al. Image quality

assessment: from error visibility to structural similarity[J].IEEE Transactions on Image Processing,2004.13(4):600-612

[12] Kim K I, Kwon Y. Single-image super-resolution using

sparse regression and natural image prior[J]. Pattern Analysis & Machine Intelligence IEEE Transactions on,2010.32(6):1127-1133

[13] Dong C, Loy C C, He K, et al. Image super-resolution

using deep convolutional networks[J]. IEEE transactions on pattern analysis and machine intelligence,2016.38(2):295-307

第8篇:卷积在神经网络中的作用范文

关键词: 高职院校 思想政治工作 有效途径

目前,中国社会正经历深刻变革。经济全球化、社会信息化、文化及意识形态多元化,冲击着当代高职院校学生的世界观、价值观与人生观。高职院校学生处于一个敏感、矛盾、情绪易激动的心理波动时期,对外界信息的吸收能力极强,思想观念日趋多元化,价值取向日趋复杂,个人行为的主动性不断增强,自我发展的意愿诉求日益强烈。社会环境的复杂多样和高职院学生的心理特征,使高职院校思想政治教育工作的难度加大。这就需要我们以全新视角正确认识高职院学生思想变化和行为活动的规律性,积极探索新形势下高职院学生思想政治教育的新途径、新方法与新体制。

一、正确认清高职学生思想政治工作的现状

通过对学生思想状况进行问卷调查,进一步掌握学生思想政治教育工作现状,切实增强思想政治教育工作的针对性和实效性。本次调查采取不记名电子问卷调查的方式进行,从个人价值观、理想信念和社会道德、-🔥js1996注册登录环境中青年学生思想状况、社会主义核心价值观四个角度设计问卷,抽取南京科技职业-🔥js1996注册登录2200名大二年级学生参加此次调查。实际收回问卷2132份,有效问卷2132份,回收率为96.9%。通过对收回问卷的数据统计和分析,发现目前高职院校学生思想政治教育主要存在以下问题。

(一)价值取向多元化。

调查发现,高职学生人生观和价值观的主流是积极的,健康的,有责任心、有进取心、有精神追求,但思想活动的独立性、选择性、多元性与差异性明显增强。在自我认知方面,59.33%的学生认为自己有理想有抱负,积极为自己的目标努力,抱着乐观的态度,36.49%的学生知道未来形势严峻,但现在很茫然,不知道该如何努力;成长环境、家庭教育和-🔥js1996注册登录教育对高职学生价值观形成的影响最大,分别为42.45%、29.13%、10.65%,这从侧面反映了融入日常生活中不经意的言谈举止比灌输性的教育更具影响力,要重视隐形宣教力度的渗透;在人生价值标准方面,学生认可度的高低依次为是否实现人生理想40.71%,对社会贡献的大小28.28%,人格是否高尚16.74%,社会地位的高低7.88%,金钱的多少5.02%,权力的大小1.36%;36.49%的被调查者认为在同学当中,“习惯性怀疑”的存在很普遍或较普遍,36.96%认为一般。被调查者认为在-🔥js1996注册登录环境中,“习惯性怀疑”的表现依次分别为:对贫困生的认定表示怀疑50.23%,对食堂的食品卫生及安全表示怀疑48.17%,对-🔥js1996注册登录的奖惩制度表示怀疑41.42%,对人与人之间的信任表示怀疑33.96%,对入党人选的产生表示怀疑32.36%,对课程成绩表示怀疑20.06%。

(二)缺乏精神追求,价值信仰不坚定。

调查发现,高职学生初步接触社会面临复杂的社会问题时,大部分学生缺乏对爱国主义精神的认同感,导致价值信仰不坚定,缺乏精神追求。影响高职学生爱国主义精神的因素依次为:社会不良风气影响46.29%,社会贫富差距加大16.89%,官员腐败问题14.54%,社会不公问题15.01%,就业难问题7.27%;有61.63%的被调查者了解或比较了解“中国梦”。62.48%的被调查者对中国梦比较有信心,但认为需要较长时间和较大努力实现,21.53%选择完全有信心,认为一定可以实现;50.28%的被调查者认为,-🔥js1996注册登录对培育和践行社会主义核心价值观比较重视,但存在走形式的现象;70.5%认为志愿者活动对加强大学生社会主义核心价值观教育发挥的作用更大,55.25%认为思政课程发挥的作用更大;34.57%表示愿意通过志愿者活动学习社会主义核心价值观,其次是-🔥js1996注册登录教育,占26.83%。

问卷中设计了三种遇到某具体社会现象时的个人判定。当问及如果遇到有人摔倒,32.08%的学生选择必须扶,27.16%的学生选择说不清,21.67%的学生选择报警求助,同样有11.77%的学生选择不敢扶,这也折射出了另一个社会诚信问题,缺乏起码的道德信任,诚信问题缺失,导致许多人需要帮助,但没人敢帮,怕给自己带来不必要的麻烦;52.81%的学生不会为节省时间而闯红灯、翻栏杆,44.93%有时会;如果看到别人都在闯红灯、翻栏杆,56.99%的学生依然选择遵守交通规则,21.62%选择装作没看到。由此可见,高职学生社会公德意识整体上比较强,社会的进步在高职学生身上得到充分体现。多数高职学生的社会道德、社会公德都是传递着正能量的,体现了当代大学生的素质,主动让行,主动维护社会秩序。

(三)互联网给高职院校思想政治工作增加了难度。

21世纪是一个高度信息化的时代,是网络空间支撑的世纪。随着信息技术的不断发展和扩散,网络已经渗透到学生学习、生活的各个方面,改变着学生学习和生活的方式,也成为他们生存、生活的另一个平台。一方面,互联网内容丰富、针对性强、覆盖面广,对高职学生开阔视野、拓宽知识领域起到了积极的促进作用。另一方面,网上信息庞杂多样,良莠并存,不良信息危害高职学生的身心健康,网络交流、虚拟社区阻碍部分学生现实情感的交流和发展,匿名化使得网上道德观难以确立,网上形象、生动、及时、快速的新信息也使学生对相对严肃滞后的思想政治教育产生逆反和厌倦心理。

调查中,38.6%学生认为“网络成瘾”现象很普遍或较普遍,35.6%学生认为“网络成瘾”现象一般,25.8%认为很少或几乎没有;68.01%的学生上网的频率是每天一次或多次;造成网络成瘾的原因主要为空余时间多,空虚无聊(59.62%),现实压力过大,将一切娱乐化以逃避现实的压力(59.13%),社会价值观体系紊乱,缺乏健康的公民文化土壤(28.85%);学生上网的主要目的依次为获取信息(62.71%),娱乐、音乐、电影、玩游戏(60.18%),交流论坛、博客(46.81%),使用生活助手(网上求职、教育、购物、销售、网上银行)40.06%,上网做作业(31.43%)。

二、切实创新高职学生思想政治工作的方法

(一)以心理健康教育为切入点,设计符合人才成长规律的思想政治工作思路。

每个学生都有自己特有的属性、人生观和价值取向,现有的思想政治工作强调共性教育,难免对学生个体不能准确把握,从而导致思想政治教育实效性不强。因此,有必要把心理学有关原理和规律运用到思想政治教育工作当中,针对学生不同的特点,有的放矢,着重解决大学生在思想观念、价值取向、行为方式等方面存在的深层次问题。

1.将心理健康教育纳入德育工作计划,系统地进行心理健康教育。对大一新生开展对新的生活环境、学习环境的适应性教育,对大二学生开展学习过程中的心理教育,对大三大四学生开展恋爱、就业的心理疏导。

2.建立心理档案,积极开展大学生心理辅导和咨询工作。对全体新生进行心理普查,了解他们的心理状况,建立新生心理档案。对已经发现有心理障碍的学生追踪了解,及早发现问题、解决问题。

3.加强对高职院校辅导员的心理咨询培训。辅导员具有开展心理健康教育的天然优势,也拥有更多机会了解学生,更容易与学生进行思想情感的沟通交流,他们可以很好地掌握每个学生的个性、家庭状况、交友关系及其他问题,并在此基础上有计划地针对每个学生进行有效指导。

(二)充分发挥“两课”教学主渠道作用,坚定学生马克思主义信仰。

1.转变教学观念,从新的高度理解“两课”教学的作用和功能。“两课”教学不是单纯的文化知识的传授,更是对学生进行马克思主义理论和思想品德教育的主阵地。进行教学时,要密切联系社会主义现代化建设面临的新形势、新任务及学生思想政治状况的新变化,既要注意理论深度又要贴近现实生活,使“两课”教学内容深入浅出,生动简明,有吸引力,切实增强“两课”教学的科学性、系统性和针对性。

2.改进课堂教学。“两课”在内容上要理论联系实际,注意掌握学生的思想特点和关注的热点、难点问题,循循善诱,因势利导,引导他们正确认识形势,明辨是非,客观冷静地分析问题、思考问题、评判问题;在教学方法上,力戒空谈说教,要发挥学生主体作用,由单一灌输转变为双向交流,重在引导,将有意识注入和无意识熏陶相结合,以“润物细无声”的方式,潜移默化地将先进思想意识灌输到学生的思想中。

3.优化教学手段。充分发挥网络教育方式多样、直观形象的优势,把严肃抽象的理论教育内容变得生动、形象、有趣,帮助学生生动形象地学习和领会“两课”的丰富内涵。同时,-🔥js1996注册登录要创造条件,开辟“第二课堂”,举办专题讲座,同时引导学生积极参加社会公益活动,参与社会调查、社会考察等社会实践等活动,增强社会责任感,培养艰苦奋斗的精神,让学生在活动中将单纯的政治理论观点内化、吸收、升华,从教育内容和现实社会的结合中寻找真谛,从人本主义教育的体验中学会做人。

(三)建立健全校园信息网络。

充分利用新媒体平台的辐射力、吸引力和感召力,弘扬主旋律,抢占主战场,使学生树立起正确的人生观与价值观,形成正确的网络伦理道德。

1.建立主流网站和网页,充分利用新媒体,让马克思主义和先进文化成为网络信息的主旋律。借助自身所拥有的人才、技术优势,建立起具有科学性、知识性、趣味性的网站,并充分发挥-🔥js1996注册登录官方微博、微信的引导和互动作用,使之成为网络时代思想政治工作的一个重要平台。

2.积极引导BBS上的舆论,及时回应,在第一时间以关心、帮助的态度回复,随时与学生进行平等交流,回答学生提出的问题,解决学生提出的一些迫切需要解决的问题,将许多现实可能激化的矛盾在网上消解。对突发事件、重要事件要及早信息,以避免虚假的信息、偏激的意见在BBS上形成规模。

3.建设一支思想过硬的网上宣传队伍。对思想政治教育工作人员进行网络知识的培训,使他们能充分利用现代化的教学手段,学会通过互联网及时、快速地获取信息、分析信息、反馈信息,做好网络信息传播的“把关人”,并引导大学生查找和利用正确有益的网上信息,主动参与网络文化的建设。

(四)加强校园文化建设。

校园文化是通过一定的物质环境和精神气氛使生活在其中的每个成员都有意无意地在思想观念、心理因素、行为准则、价值取向等方面与现实文化发生认同,从而实现对人的精神、心灵、性格的塑造。因此,校园文化的建设尤显重要。

1.转变教育理念,重新定位校园文化。校园文化的核心和实质是超功利主义的,它的出发点是人的发展,以文化为载体,着眼于精神建设,服务于人的全面发展。当学生长期置身于校园文化形成的浓郁的精神氛围中,就能够在潜移默化中受到熏陶,不自觉地形成良好的文化意识和文化品格。

2.发挥好校园文化的导向功能,找准切入点弘扬主旋律,让健康向上、催人上进的文化占领校园文化主阵地,使学生能自觉地摒弃腐朽落后、低级庸俗的文化,起到环境育人的作用。

3.大力开展形式多样、丰富多彩,富有感染力和吸引力的校园文化活动,如举办各种主题的校园文化节,广泛开展校园文明创建活动,举办文艺晚会、辩论赛、知识竞赛、作品展等多样化的文化艺术教育活动,在校内营造出多层次、多类型、系列化、规模化和品牌化的独特校园文化氛围。

参考文献:

第9篇:卷积在神经网络中的作用范文

[关键词] 人格;网络孤独;因素分析;网络服务

1 引言

网络最初是作为提供信息的科技发展起来的。网络的使用者也被认为是信息的搜索者。近年来,网络逐渐发展为一种社会性的科技,被广泛运用于人际沟通(Pew Internet&Amerlcalrl Life,2002),向大众提供支持和归属感(Sproull&Faraj,1995,for a review)。根据中国互联网络发展状况统计报告(2006年7月)统计显示中国网民已过亿。正是网络的快速发展及其影响让心理学家开始关注。一项网络使用调查显示(Brennet,1997),大部分网络使用者认为网络于扰了生活;一部分甚至报告出现类似成瘾问题。而且,网络的运用可能导致社会的隔离(stoll,1995;Turkle,1996)、心理健康水平的下降(Kraut,Patterson,Lundmark,Muko-padhyay&scherlis,1998)等。与此相反,部分学者描绘了网络对个体健康的积极影响。如,sprouu and Faraj(1995)就强调了网络在人际沟通渠道上的发挥重要社会作用。McKenna and Bargh(1998)认为,网上虚拟团体可以帮助他们远离不良群体.如同性恋,通过匿名的方式实现社会化。

孤独感是一种不良情绪体验,“当个体社会关系太小或者不能满足他的需要时孤独感便产生了”(Peplau,Russell,&Helm,1979)。孤独感与人的身心健康关系密切,国外已把孤,独作为评定心理健康水平的一个重要指标,广泛应用于精神病学、心理咨询和治疗及群体心理卫生的调查与研究中。孤独与网络的过度使用存在持久的联系。“网络能提供给他们交往和反应的工具,提供与现实相反的、安全的、趣味的空间”(Morahan-Mnatin,1999,p.48)。也有很多人利用网络逃避压力和不舒适感(Kraut,Patterson,Lundmark,Kiefler,Mukopadhyay,1998)。Kraut,et a1(1998)在一项研究中测量网络对社会卷入程度和心理健康水平的影响,发现网络的过度使用与使用者的孤独体验相关。Stdl(1995)&Turkle(1996)也认为网络的使用可能导致社会隔离。

上述研究主要分析孤独和网络的使用或网络与使用者的人格特征等关系。笔者在此研究基础上对使用者人格特征和网络服务的丰富性对孤独感水平的影响方式进一步讨论。

2 对象与方法

2.1 被试主要是湖南城市-🔥js1996注册登录计算机系及武汉大学心理学专业的部分学生。共发放问卷90份,剔除无效问卷后最终获得84份有效问卷。其中男生49人,女生35人,年龄在21~28岁之间。

2.2 研究工具

2.2.1 网络使用问卷自编问卷。该问卷主要报告网络的使用频度。项目的选择是根据中国互联网络发展状况统计报告(2006年7月)内容,问卷由16个项目构成;找工作;学习;一般信息查询;群聊;下载游戏,软件下载;聊天室;看新闻;性网站;收发邮件等。每一项5级记分(从1-根本不用,到5-经常用)。根据探索性因素分析,两次结构分析转轴后所得4个因子的特征值大于1,占总方差的71.03%,分别命名为娱乐服务、技术服务、社会服务、信息服务,各维度的内部一致性系数Crotibach a分别为0.829、0.742、0.627、0.770,总问卷的内部一致性系数Cronbach a为O.868。

2.2.2 大五人格问卷本研究采用简化版大五人格问卷,测定被试的外向性、宜人性、尽责性、开放性和神经质性。具有较高的信效度,重测信度为0.72,内部一致性相关系数是0.44。

2.2.3 UCLA孤独量表该量表为一维的,主要测“对社会交往的渴望与实际水平的差距”而产生的孤独感,针对的是被检查者的人际关系质量,偏重于个体的主观孤独感。量表共20个条目,4级评分,高分表示孤独程度高。该置表α系数为0.8419,重测相关为0.6239。

2.3 统计分析用SPSS 12.0、Amosa5.0统计软件对结果进行t检验、相关分析及路径分析。

3 结果

3.1 网络使用问卷的因素分析利用最大方差旋转对网络服务进行主成分探索性因素分析。为增加该量表的效度,第一次旋转后从量表中省去负数值不明显的项目:搜索一般信息、性网站等,将剩下的13项进行第二次结构因素分析。结果得出4个因子的特征值大于1,占总方差的71.03%,其中因子1占23.88%。各因素的负荷值和所占方差百分比。经认证后分别将因素命名为娱乐服务、技术服务、社会服务、信息服务。这些因素与一般网络服务占有情况是一致的。

3.2 UCLA孤独量表评定结果大学生整个孤独量表得分成正态分布。UCLA得分平均分39.964±8.187,其中男生41.327±5.987,女生38.057±10.324。经方差分析显示性别之间的得分无显著性差异(P>0.05)。

3.3 不同孤独感程度的人格特质、网络服务比较全部大学生被试的孤独感得分均分呈正态分布。根据孤独感总均分为划界值,将该被试分成高水平组和低水平组。比较两组在人格特征、网络服务方面的差异,从结果得知,尽责性和神经质性上均存在显著性差异,尤其是在神经质人格特征中出现高度显著性差异(P<0.01);技术服务和信息服务这两种网络服务的使用上也出现了显著性差异(P<0.05)。

3.4 人格倾向、网络服务对互联网使用者孤独感的影响方式

首先,为确定网络使用者的孤独感与哪些人格倾向、网络服务项目直接关联,本研究对孤独感与外向性、宜人性、尽责性、开放性、神经质和娱乐服务(F1)、技术服务(F2)、社会服务(F3)、信息服务(F4)与水平进行了相关分析(见表3)。从表3可见,网络使用与孤独感水平之间的相关达到了显著水平(P<0.05)。具体而育,F2、F3与孤独感水平呈现显著性负相关。人格倾向与孤独感也存在一定程度相关,其中宜人性与孤独感水平呈现高度负相关(P<0.01)。

然后,笔者以Amos5.0对人格特征和网络服务对网络孤独感的影响方式进行路径分析,使用结构方程模型对数据与

假设模型的拟合度进行了验证。通过逐步删除饱和模型中的不显著路径,得到如附图所示的关系模型。

人格特征、网络服务除了对网络孤独感具有直接预测作用外,宜人性、开放性、神经质倾向还通过不向的网络服务间接影响网络孤独感。进一步对路经模型中的路径系数的分解。

结果发现,在影响网络孤独感的诸因素中。宜人性人格特征作用最大,其次是网络的社会服务和信息服务,影响最小的是网络的技术服务;神经质、开放性对网络孤独感的直接影响大于间接影响。

4 讨论

4.1 不同孤独感水平的人格特征和利用的网络服务研究者发现,孤独感既有情境性也有稳定性,人格的作用至关重要。通过不同孤独感水平组的人格特征比较发现孤独感水平较高者尽责性得分高,神经质水平较低。尽责性表示克制和严谨,与成就动机和组织计划有关,同时反映个体自控程度以及推迟需求满足的能力。在校大学生感受到社会竞争的压力,自我期望值高,责任感有所增强,但另一方面自身具备的条件、社会经验尚不满足,对未来既充满希望又惶恐不安,内心有不被理解甚至不被现在社会所接纳的感觉,感受到的孤独感强烈。而网络的游戏、虚拟成分可以减少责任的压力,能给予他们暂时性缓解的空间,一定程度上起到宣泄的作用。神经质得分高者个性内向不稳定,社交敏感等。许多研究认为孤独感水平高者具有神经质倾向。但本研究得出相反的结论。笔者认为可能和网络服务有关,文章后面关于两者对网络孤独的综合影响中将会具体解释。此外,孤独感水平较高者更善于利用网络所提供的信息类服务和利用网络技术满足自己的需要。在现实世界中他们较少通过人际交往来获取信息,为了满足对外界了解的需要因此在信息的选择渠道上更偏向人机对话式的支持方式。

4.2 人格倾向、网络服务对互联网使用者孤独感的影响方式

本研究证实了在网络环境中,部分人格特质对网络孤独有明显的直接作用。人格特质论认为,人格是一种稳定的特征,会影响到个体的行为方式,使得其对客观事物的感知带有鲜明的个性色彩。孤独感作为一种个体内部的主观情感体验,势必受到人格的影响。高宜人性者能够创造快乐的环境和生活事件。我们认为,宜人者具有关系型性格特征,由于性格随和,一般具有良好的人际关系,孤独感程度会随之降低,与_此相反,则孤独感水平较高,他们可能会将对社会关系需求满足的渴望转向网络。虽然网络世界与现实社会有差距,但在一定程度上是现实世界的反映,再者网络交流的虚拟性、隐藏性等,迎合了某些个体的需求。

本研究结果也证实了网络服务对网络孤独的直接作用。目前关于网络使用与孤独感的关系存在着两种截然对立的研究假设。过度的网络使用导致孤独感;孤独感强的人更倾向于过度使用网络。持第一种观点的认为,网络的使用将个体与现实隔离开来,剥夺了他们的归属感和现实交往的需要,于是使用者花费太多的时间、精力放在网上的关系建立上,孤独变成了过度使用网络的副产品。而且,网络交流引发了技术性的疏远,在参与者之间产生了障碍,甚至是两个原本认识的个体之间。持这种观点的人的一个潜在假设就是相对于现实生活交往而言,在线关系是薄弱的、肤浅的(Kraut,et al,1998~0.Tode,2000;Anders,Field,Diego,Kaplan,2000)。持第二种观点的认为,孤独的个体更倾向于使用网络。由于网络提供的归属感、同伴关系、人际交流的可能,孤独的个体容易被在线的交互式的社会活动形式所吸引(Morahan-Martln,1999)。网络为孤独者进行社会交往提供了一个理想的环境,主要是网络交流促进了“抑制的解除”,提供一个自我展现和社交的平台。另外,也有孤独者把网络当成逃避、减少压力,减轻与孤独相关的负性情绪,如同网络使孤独下降一样(Loytskert&Aiello,1997;Morahan-Martin&Schumacher,2000;Young,1998)。本研究似乎支持了第二种假设,即网络不是孤独产生的原因,相反是解决孤独感程度高的一种有效途径。因此,笔者认为,有效的利用网络,规范网络市场的管理,为使用者提供健康、丰富的信息,使孤独者的或非孤独者能从网络社会中获得更多的社会支持,满足人际交往的需求。

XML 地图