首页 > 文章中心 > 卷积神经网络存在的问题

卷积神经网络存在的问题

前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇卷积神经网络存在的问题范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。

卷积神经网络存在的问题

卷积神经网络存在的问题范文第1篇

【关键词】视频 行为识别 检测

近年来,各种视频监控越来越深入我们的生活中。因其实时性、直观性以及设备成本日益降低在各行各业中而倍受青睐。但视频监控系统还是依靠人工来控制,没有进入数字化的全天实时监测、智能分析图像数据。要实现完全数字化的监控的关键在于人体行为的智能识别。

早些时候有人提出并且应用了智能图像识别的卷积神经网络,它是在原始的输入中应用可训练的滤波器和局部邻域池化操作,来得到一个分级的且逐渐复杂的特征表示。实践表示,采用合适的规则化项来训练,它可以达到非常好的效果。比较好的地方是对姿势、光照和复杂背景存在不变性,单只受限在2D输入的舞台。本文文章提出了一个新的3D卷积神经网络模型,用于运动识别。该模型可以从空间和时间的维度提取特征,然后进行3D卷积,以捕捉从多个连续帧得到的运动信息。为了有效的综合运动信息,文中通过在卷积神经网络的卷积层进行3D卷积,以捕捉空间上、时间上的维度,让其都具有区分性的特征。

3D卷积是通过堆叠多个连续的帧组成一个立方体,然后在立方体中运用3D卷积核。在其中,卷积层中每一个特征map都会与上一层中多个邻近的连续帧相连,以捕捉运动信息。一个卷积map的某一位置的值是通过卷积上一层的三个连续的帧的同一个位置的局部感受得到的。要强调的是:3D卷积核只能从cube中提取一种类型的特征,因为在整个cube中卷积核的权值都是一样的,也就是共享权值,都是同一个卷积核。可以采用多种卷积核,以提取多种特征。有一个通用的设计规则就是:在后面的层(离输出层近的)特征map的个数应该增加,这样就可以从低级的特征maps组合产生更多类型的特征。本文中的3D 卷积神经网络架构包含一个硬连线hardwired层、3个卷积层、2个下采样层和一个全连接层。每个3D卷积核卷积的立方体是连续7帧,每帧patch大小是60x40。

在第一层,应用了一个固定的hardwired的核去对原始的帧进行处理,产生多个通道的信息,然后对多个通道分别处理。最后再将所有通道的信息组合起来得到最终的特征描述。这个实线层实际上是编码对特征的先验知识,这比随机初始化性能要好。

每帧提取五个通道的信息,分别是:灰度、x和y方向的梯度,x和y方向的光流。其中,前面三个都可以每帧都计算。然后水平和垂直方向的光流场需要两个连续帧才确定。所以是7x3 + (7-1)x2=33个特征maps。然后用一个7x7x3的3D卷积核(7x7在空间,3是时间维)在五个通道的每一个通道分别进行卷积。为了增加特征map的个数(实际上就是提取不同的特征),在每一个位置都采用两个不同的卷积核,这样在C2层的两个特征maps组中,每组都包含23个特征maps。23是(7-3+1)x3+(6-3+1)x2前面那个是:七个连续帧,其灰度、x和y方向的梯度这三个通道都分别有7帧,然后水平和垂直方向的光流场都只有6帧。54x34是(60-7+1)x(40-7+1)。

在紧接着的下采样层S3层max pooling,在C2层的特征maps中用2x2窗口进行下采样,这样就会得到相同数目但是空间分辨率降低的特征maps。下采样后,就是27x17=(52/2)*(34/2)。 C4是在5个通道中分别采用7x6x3的3D卷积核。为了增加特征maps个数,在每个位置都采用3个不同的卷积核,这样就可以得到6组不同的特征maps,每组有13个特征maps。13是((7-3+1)-3+1)x3+((6-3+1)-3+1)x2前面那个是:七个连续帧,其灰度、x和y方向的梯度这三个通道都分别有7帧,然后水平和垂直方向的光流场都只有6帧。21x12是(27-7+1)x(17-6+1)。

S5层用的是3x3的下采样窗口,所以得到7x4. 到这个阶段,时间维上帧的个数已经很小了。在这一层,只在空间维度上面卷积,这时候使用的核是7x4,然后输出的特征maps就被减小到1x1的大小。而C6层就包含有128个特征map,每个特征map与S5层中所有78(13x6)个特征maps全连接,这样每个特征map就是1x1,也就是一个值了,而这个就是最终的特征向量了。

经过多层的卷积和下采样后,每连续7帧的输入图像都被转化为一个128维的特征向量,这个特征向量捕捉了输入帧的运动信息。输出层的节点数与行为的类型数目一致,而且每个节点与C6中这128个节点是全连接的。采用一个线性分类器来对这128维的特征向量进行分类,实现行为识别。模型中所有可训练的参数都是随机初始化的,然后通过在线BP算法进行训练。

3D 卷积神经网络模型的输入被限制为一个少的连续视频帧,因为随着输入窗口大小的增加,模型需要训练的参数也会增加。当然有些人的行为是跨越很多帧的,所以在3D 卷积神经网络模型中,有必要捕捉这种高层的运动信息。需要用大量的帧来计算运动特征,然后把这些运动特征作为辅助输出去规则化3D 卷积神经网络模型。

对于每一个需要训练的行为,提取其长时间的行为信息,作为其高级行为特征。这个运动信息因为时间够长,所以要比卷积神经网络的输入帧的立方体包含的信息要丰富很多。然后我们就迫使卷积神经网络学习一个非常接近这个特征的特征向量。这可以通过在卷积神经网络的最后一个隐层再连接一系列的辅助输出节点,然后训练过程中,使提取的特征更好的逼近这个计算好的高层的行为运动特征向量。

试验中,在原始的灰度图像中计算稠密sift描述子,然后通过这些sift描述子和运动边缘历史图像(MEHI)组合构造bag-of-words特征作为辅助特征。 因为灰度图保留了外观信息,运动边缘历史图像只关心形状和运动模式,所以可以提取这两个互补的信息作为两个连续帧的局部特征bag。先简单的计算两帧间的差分,这样就可以保留运动信息,然后对其执行一次Canny边缘检测,这样可以使得观测图像更加清楚简洁。最总的运动边缘图像就是将历史的这些图像乘以一个遗忘因子再累加起来得到。

本文中,构造不同的3D 卷积神经网络模型,它可以从输入捕捉潜在的互补信息,然后在预测阶段,每个模型都针对一个输入得到对应的输出,然后再组合这些输出得到最终的结果。

作者简介:

卷积神经网络存在的问题范文第2篇

关键词:图像采集和处理;图像检测;Gabor纹理滤波;神经网络

DoI:10.15938/j.jhust.2016.06.009

中图分类号:TPl83;TP391.4

文献标志码:A

文章编号:1007-2683(2016)06-0044-06

0.引言

钢铁企业为了提高竞争力,对带钢的生产提出了新的要求,也对带钢表面检测系统提出了更高的要求,既要有更高的检测速度还要有更加准确的检测精度,而与此同时,跟随机器视觉技术的发展,带钢表面检测系统也得到了广泛的研究与应用,主要研究包括:①光源技术,由于带钢检测对光源要求频度高、体积小,这限制了传统光源在其应用,激光具有方向性好、亮度高、体积小等优点,被广泛应用于带钢检测应用中,国内的徐科等提出热轧钢检测中用绿光作为激光光源,但激光照明需解决均匀性问题.②扫描技术,由于电荷耦合元件(charge-coupled device,CCD)能够实现实时检测,成为目前研究和应用的主流技术,但是,CCD电荷耦合器需在同步时钟的控制下,以行为单位一位一位地输出信息,速度较慢,而互补金属氧化物半导体(complementary metal oxide semiconductor,CMOS)光电传感器采集光信号的同时就可以取出电信号,还能同时处理各单元的图像信息,速度比CCD电荷耦合器快很多,③图像处理算法,受限于带钢加工过程的特性,带钢表面呈现出随机纹理的特点,对于随机纹理图像的处理分析,目前常用的方法有共生矩阵法、频域滤波法、分形法等,作为频域滤波法的代表,二维Gabor滤波器有着与生物视觉系统相近的特点,广泛应用于纹理图像的处理分析,但是,CPU很难满足现在的带钢检测的实时要求,④分类算法,特征选择的主流算法是主成分分析和信息增益,主成分分析存在特征向量方向不一致的问题,而且如何确定主成分存在主观性,信息增益可以衡量特征的劣,利用它可对特征进行排序,方便后面的特征选择,但信息增益适用于离散特征,信息增益率既适用于离散特征也适用于连续特征,被广泛应用于特征选择的过程中,图像分类算法主流算法包括支持向量机和BP神经网络,支持向量机不适用于大样本的分类问题,BP神经网络方法具有能够解决非线性分类问题,对噪声不敏感等优点,被广泛应用于带钢检测中,如王成明等提出的基于BP神经网络的带钢表面质量检测方法等,但是BP神经网络的超参的设定往往具有随机性,这严重影响了分类效果。

本文首先介绍了带钢表面缺陷高速高分辨率成像系统的设计,针对光源的不均匀性、图像处理速度慢等问题,提出改进方法,然后介绍了分类器的构建,针对样本划分的随机性、特征选择的随机性以及BP神经网络超参设定的随机性问题,做出改进,最后介绍试验结果。

1.带钢表面缺陷高速高分辨率的成像系统的设计

1)大功率半导体均匀发光激光器技术,激光能够保证带钢表面缺陷的检出率,本系统选用808mm半导体激光器作为照明源,出光功率可达30w,亮度可达1500流明,激光照明需解决均匀性的问题,本文采用了基于鲍威尔棱镜的激光线发生办法,解决了激光照明的均匀性问题,其光路如图1所示。

该方法首先在激光聚焦位置放置圆形球面透镜,负责将发散的激光束汇聚成准平行光,同时控制光柱的粗细,然后,利用鲍威尔棱镜的扩散效果对圆柱的一个方向进行扩束,最终形成激光线,为保证亮度及宽度的适应性,激光器出光口距离圆透镜、鲍威尔棱镜的距离可以精密调整,为了降低反射亮度损失,在透镜表面镀上808±5nm的T≥99%的增透膜。

GPU的算法分为两个流程:训练过程主要针对无缺陷图像进行,通过训练完成纹理图像的背景建模,一方面消除背景变化带来的干扰,另一方面形成有效的Gabor卷积参数,以便在检测过程中得到最优的检出效果.检测过程对实际拍摄的缺陷图像进行分析,首先按照GPU的核心数和缓存大小对图像进行分解,本文所有GPU的核心数为1024,显存2G,因此将原始图像分解为1000块,分别加载到1000个核心中,同时并发运行卷积运算.最后将各个窗口的卷积结果合并到一起,得到完成的滤波结果,最后借助于背景模式,将背景的干扰消除,得到干净的缺陷区域。

3)成像系统,根据缺陷检测的精度要求(1800m/min的检测速度,0.25mm的精度),带钢的规格要求(1900 mm规格),对带钢进行成像系统设计,基于互补金属氧化物半导体(CMOS)的成像芯片具有速度快,用电低等优势,选用两个4K线扫描CMOS相机作为成像核心器件,选用Camera Link Full接口作为数据输出,两个4K扫描中间重叠100mm作为图像拼接区,两组线激光光源与线扫描组成系统的主要成像模块,成像系统结构如图3所示。

2.构建分类器

检测缺陷类别及其特征描述如表1所示:

1)训练集和样本集划分.主要缺陷类别有5个,每个类别收集样本7000,共计35000个样本,为了避免训练集和样本集划分的盲目性,采用10一折交叉验证的方式划分训练集和测试集,即将样本集分成10份,从中选1份为测试集,剩下的为训练集,如图4所示,究竟选择哪一份作为测试集,需在后面的嵌套循环中实现。

2)特征选择,缺陷区域的长度、宽度、面积、区域对比度等共计138个特征形成初始特征集合,利用信息增益率来对各个特征排序。

上述各循环组合在一起就是一个嵌套循环,其N-S盒图如图5所示,最外层是测试集和训练集的10折交叉验证,第1层是确定最优的特征数,第3层是确定最优的隐含层节点数,第4、5层是确定最优的输入层和隐含层、隐含层和输出层的初始权值。

经以上循环,确定D3作为测试集,最优特征数为23个,最优的隐含层节点数是46个,同时也确定了最优的初始权值,对应的3层BP神经网络的网络模型如图6所示。

3.实验结果

1)鲍威尔棱镜与柱透镜进行对比在实际工作距离1.5m处,采用0.1m为间隔使用光功率计测试光源功率,如图7所示,横轴为测试点,纵轴为测试点的光功率。实验表明,鲍威尔棱镜均匀性优于柱透镜。

2)Gabor滤波方法与其他方法比较将动态阈值法+Blob分析法(方法A)和灰度共生矩阵纹理背景消除法(方法B)两种方法与Gabor滤波方法进行比较,如图8所示.由于缺陷与背景灰度相近(图(a)),致使方法A缺陷丢失(图(b)),由于缺陷与背景纹理相近(图(d)),致使方法B产生噪声(图(e)),Gabor方法取得了不错的效果(图(e)、(图(f)))。

3)GPU与CPU比较以4096×4096的图像为例,选10幅有代表性图像,利用CPU(最新的inteli7-2600处理器,4核8线程,2.6GHz,内存8G)和GPU(nVidiaGTX970,4G存显卡)进行Ga-bor运算,计算时间如表2所示,GPU计算效率明显优于CPU,其中CPU的平均耗时为290.4ms,而GPU的平均耗时为31.7ms。

4)检测效果在产线速度为1775m/min,最小检测缺陷的尺寸为0.25mm的检测系统中,对带钢的主要4种类型缺陷进行检测统计,检测结果如表3所示。

可计算出整体检出率99.9%,检测准确率99.4%。

卷积神经网络存在的问题范文第3篇

关键词:图像;情感;视觉特征;对应关系;分类

中图分类号:TP391文献标识码:A文章编号:1009-3044(2011)21-5231-02

图像中蕴含着情感信息,如何有效地模拟人观察图像后引起的情感感觉,实现基于语义的图像检索,是一个热点且有挑战性的课题。过去的图像语义分析中,大都是根据图像的低层特征简单的语义分类,很少涉及情感语义范畴;目前的研究中多是提取图像的低层视觉特征并建立特征与情感的对应以实现图像情感分类。

图像情感语义分类的关键是如何提取有效表达图像情感的视觉特征,并根据视觉特征与高阶语义的对应关系,选择合适的分类算法。当前研究中一般选择某一类图像,如服装图像、天气图像等,在提取图像的视觉特征中大都采用某一个视觉特征或者组合两个视觉特征,高层语义分类一般是一对相反的形容词,如服装图像为“优雅”的和“俗丽”的,天气图像为“喜欢”的和“厌恶”的等,通常采用神经网络和支持向量机等方法进行分类。

1 图像的主要视觉特征

1.1 颜色特征

颜色特征是一种全局特征,有多种提取方法,可以分为两大类:一是提取全局颜色信息的颜色特征;二是提取局部颜色信息的颜色特征。

在提取颜色特征中颜色直方图是常用的有效方法,它反映了不同色彩在图像中的比例。数字图像大部分是基于RGB颜色空间的,但RGB空间结构在颜色相似性上与人们的主观判断不一致,所以多选择基于HSV等空间的颜色直方图[1]。

1.2 纹理特征

纹理特征也是一种全局特征,常用的特征提取与匹配方法:灰度共生矩阵、Tamura纹理特征、Gabor小波变换等。

灰度共生矩阵主要提取能量、惯量、熵和相关性4个参数;Tamura 纹理特征主要用粗糙度、对比度、方向度、线像度、规整度和粗略度6种属性表示;Gabor变换用Gabor核函数与样本卷积,分别提取数据的均值和方差作为特征数据,获得原图在不同频率和相位下的小波系数,使每个样本得到一个多维特征向量用于分类[2]。

1.3 形状特征

形状特征是图像的一个重要特征,常用两类方法表示,一是轮廓特征,二是区域特征。轮廓特征针对的是物体的外边界,区域特征则是整个形状区域。常用来描述形状特征的方法有:边界特征法、傅里叶形状描述符、几何参数法、不变矩法等。

边界特征法用边界特征的描述得到图像的形状参数,经典方法有Hough变换检测平行直线和边界方向直方图;傅里叶形状描述符采用物体边界的傅里叶变换描述形状;几何参数法是描述区域特征方法;不变矩法利用目标所占区域的矩描述参数。

2 情感空间的建立

图像情感语义的提取,是将图像映射到一个情感空间,每个图像对应着情感空间的一个点,每个点代表某种情感的描述,这样点之间的距离对应着图像的情感距离,即把观察图像后感受到的情感信息用语义描述,并定量比较。

根据实际情况,常构造一些简化的情感空间模型。Colombo等建立的是图像到愉快、紧张、放松、动感这几个基本情感的映射[3];毛峡等根据1/f波动理论,主要讨论了图像中和谐舒适、杂乱、单调三类情感感觉[4]。

目前获得人们对图像主观情感的方法,多采用调查法,即选择尽可能多的不同年龄、背景、文化程度等的人对图像进行情感描述。

3 图像情感分类识别

目前常用的是基于人工神经网络分类方法和基于支持向量机的分类方法。

3.1 人工神经网络

人工神经网络用计算机模拟生物机制,它不用对事物内部机制很了解,系统的输出由输入和输出之间的连接权决定,连接权是通过对训练样本的学习获得的。比较有代表性的网络模型有感知器、多层前馈BP网络、RBF网络等。

3.2 支持向量机

支持向量机的基础是统计学习理论,设计原则是结构风险最小化,针对的是有限样本的一种机器学习算法,它的优势是在解决模型选择与过学习问题、非线性与维数灾难问题、局部极小值问题等问题上很有效,基本原理是通过非线性变换把输入空间变换到高维空间,然后在新空间中获得最优或是广义最优线性分类面。

4 总结与展望

图像的情感语义研究是一个较新的研究方向,对这个领域的研究还不多,很多问题研究的还不够深入。目前的研究存在的局限主要有:一是图像的选取比较单一,只能分类描述同一事物的图像,如天气、衣服图像;二是反映图像情感的视觉特征比较少,多是用颜色特征描述情感,用纹理和形状描述情感还不多,将多种视觉特征融合起来更少;三是对图像的情感分类比较少,多是二分类,少有多种分类的研究,而一幅图像蕴含着多种情感,一对或较少的形容词并不能有效反映图像的情感。今后图像情感的分类要在以下几方面多做研究:一是扩大图像的选择范围;二是有效选择融合尽可能多的视觉特征;三是丰富对图像的情感分类。

由于图像的情感研究涉及到众多学科领域,研究起来有一定难度,对它的研究还在初步阶段,要解决的问题还比较多,所以发展潜力很大。

参考文献:

[1] 贺静.基于特征融合的服装图像情感语义分类研究[D].太原理工大学,2007.

[2] 赵志艳,杨志晓,李卓瑜,等.一种基于纹理特征的笔迹鉴别方法[J].微计算机信息,2010,26(1-2).

卷积神经网络存在的问题范文第4篇

在为人们提供便捷服务的同时,互联网应用也存在很多安全问题及威胁,如计算机病毒、变异木马等,利用大规模互联网集成在一起产生的漏洞攻击网络,导致数据泄露或被篡改,甚至使整个网络系统无法正常运行。随着网络接入用户的增多,互联网接入的软硬件资源也更多,因此对网络安全处理速度就会有更高的要求,以便能够提高木马或病毒处理速度,降低网络病毒的感染范围,积极的响应应用软件,具有重要的作用和意义。

2网络安全防御技术应用发展现状

目前,人们已经进入到了“互联网+”时代,面临的安全威胁也更多,比如木马病毒、DDOS攻击和数据盗窃等。互联网受到的攻击也会给人们带来严重的损失,比如勒索病毒攻击了许多的大型跨国公司、证券银行等,到这这些政企单位的办公电脑全都发生了蓝屏现象,用户无法进入到操作系统进行文件处理,勒索病毒要求这些单位支付一定额度的赎金才可以正常使用系统,导致许多公司损失了很多的资金。分布式服务器攻击(DDOS)也非常严重,模拟大量的用户并发访问网络服务器,导致正常用户无法登陆服务器。因此,为了提高信息安全,人们提出了防火墙、杀毒软件或访问控制列表等安全防御技术

2.1防火墙

防火墙是一种比较先进的网络安全防御软件,这种软件可以设计很多先进的规则,这些规则不属于互联网的传输层或网络层,可以运行于互联网TCP/IP传输协议栈,使用循环枚举的基本原则,逐个检查每一个通过网络的数据包,如果发现某个数据包的包头IP地址和目的地IP地址及包内容等存在威胁,就可以及时的将其清除,不允许通过网络。

2.2杀毒软件

杀毒软件是一种非常先进的程序代码,其可以查杀网络中存在的安全威胁,利用病毒库中一些收录的病毒或木马特征,判断互联网中是否存在这些类似的病毒或木马。杀毒软件采用了很多技术,如主动防御、启发技术、特征码技术、脱壳技术、行为分析等,这些都可以实时的监控访问互联网的运行状态,确保网络正常使用。目前,许多大中型企业都开发了杀毒软件,比如360安全卫士、江民杀毒、腾讯卫士、卡巴斯基等,取得了显著的应用成效。

3基于人工智能的网络安全防御系统设计

3.1系统功能分析

基于人工智能的网络安全防御系统利用机器学习或模式识别技术,从互联网中采集流量数据,将这些数据发送给人工智能模型进行分析,发现网络中是否存在网络病毒。具体的网络安全防御系统的功能包括以下几个方面:

3.1.1自动感知功能

自动感知是人工还能应用的一个重要亮点,这也是网络安全系统最为关键的功能,自动感知可以主动的分析互联网中是否存在安全隐患,比如病毒、木马等数据片段,利用这些片段特征实现网络病毒的判断。

3.1.2智能响应功能

人工智能在网络安全系统中可以实现智能响应,如果一旦发现某一个病毒或木马侵入网络,此时就需要按照实际影响范围进行智能度量,影响范围大、造成的损失较多就可以启用全面杀毒;影响范围小、造成的损失较少就可以启动局部杀毒,这样既可以清除网络中的病毒或木马,还可以降低网络的负载,实现按需杀毒服务。

3.2人工智能应用设计

人工智能在网络安全防御中的应用流程如下所述:目前互联网接入的设备非常多,来源于网络的数据攻击也非常多,比如DDOS攻击、网站篡改、设备漏洞等,因此可以利用人工智能技术,从根本上发现、分析、挖掘异常流量中的问题,基于人工智能的网络安全系统具有一个显著的特征,这个特征就是利用先进的机器学习技术构建一个主动化防御模型,这个模型可以清楚网络中的木马或病毒,能够有效的避免互联网受到攻击,也可以将这些病毒或木马牵引到一些备用服务器,在备用服务器上进行识别、追踪,判断网络病毒的来源,从而可以彻底根除后患。人工智能在网络安全防御中引入很多先进的杀毒技术,比如自我保护技术、实时监控技术,基于卷积神经网络、机器学习、自动审计等,可以自动化快速识别网络中的病毒及其变异模式,将其从互联网中清除,同时还可以自我升级服务。

4结束语

目前,互联网承载的应用软件非常多,运行积累了海量的数据资源,因此安全防御系统可以引入数据挖掘构建智能分析系统,可以利用人工智能等方法分析网络中是否存在一些病毒特征,即使这些病毒特征发生了变异,人工智能处理方法也可以利用先进的机器学习技术发现这些病毒的踪迹,从而可以更加准确的判断病毒或木马,及时的启动智能响应模块,将这些病毒或木马清除。人工智能在查杀的时候还可以按需提供服务,不需要时刻占据所有的负载,提高了网络利用率。

参考文献

[1]于成丽,安青邦,周丽丽.人工智能在网络安全领域的应用和发展新趋势[J].保密科学技术,2017(11):10-14.

[2]王海涛.基于大数据和人工智能技术的信息安全态势感知系统研究[J].网络安全技术与应用,2018(03):114-115.

卷积神经网络存在的问题范文第5篇

关键词:大学计算机基础;教学改革;人工智能;智慧课堂

云计算、大数据、人工智能新兴领域的崛起,推动信息技术全面渗透于人们的生产生活中。信息技术的核心在于计算机技术和通信技术。然而,虽然目前各个高校都开设了计算机基础课程,但是其教学却存在着诸多问题,导致该课程无法达到预期的教学效果。教育部在2012年《教育信息化十年发展规划(2011-2020年)》,其中指明“以教育信息化带动教育现代化,促进教育的创新与变革”[2]。因此,本文以华中师范大学计算机基础课程教学为例,深入阐述了传统计算机基础课程教学的弊端,提出了在当前人工智能如火如荼的时代背景下,如何应用人工智能相关技术对传统的计算机基础教学进行改革的具体方案。该方案以创建网络智慧课堂教学模式改革为主体,辅以教学观念、知识体系和课程考核方式改革,以期对高校的计算机基础课程教学有所裨益。

1传统教学的缺陷

⑴课程的教学地位没有引起足够的重视一些高校为计算机基础课程分配较少的学时(少于48学时),甚至有的专业将此课程设置为选修课。这种设置降低了该课程在教师和学生心目中的位置,导致了对该课程的忽视。同时,不少老师因为学时不够,时间紧迫,仅仅讲述与考试相关的内容,不考的一概不讲。这导致学生的眼界受限,知识和能力受限,无法培养其全面综合的计算机素质。还有的专业没有将这门课给专业的计算机学院的老师讲授,而是随意安排授课人员。没有经过系统专业训练的教师缺乏足够的知识储备,很难讲好这一门看似简单的课程。⑵课程教学内容的制定与当今时代对于信息化人才的需求脱节一些高校的现状是计算机基础的课程教材知识陈旧[3]、质量堪忧,教材总是无法跟上知识更新的步伐,例如都2019年了还在讲Office2010。有的高校由于缺乏对课程的重视,没有对教材优中选优,而是基于利益的考虑,优先选择自己院系编写的教材。其教材内容是七拼八凑,没有整体性、逻辑性和连贯性,更不用说前瞻性。这样的教材,无疑对学生的学习设置了巨大的屏障。除此以外,一些院校的课程教学知识体系不够明确和完善,教学大纲的制定不够科学。从教学大纲中制定的学时分配来说,常常偏重实用性[4],常用计算机软件操作占据了大部分的课时。这会让教师在授课时轻理论而重操作,如此培养学生,非常不利于其计算思维的形成,对后续其他计算机相关课程的学习也是很大的伤害。⑶教学模式过于传统,信息化水平较低从教学方式上来说,传统的教学模式以教师课堂授课为中心,是以教师为主体的教学模式[5]。在这种模式下,教师仍然主要以填鸭式教学为主[6],无法通过课堂教学发现学生的个性化特点,并进行有针对性的教学。另外,虽然计算机基础课程一般都配备了实验课时,但是实验课常常是采用教师布置上机任务、学生做完抽样检查的模式。这对于大课堂来说,教师的任务繁重,无法搜集到每一个学生的任务完成情况,无法清晰地掌握学生学习的实际情况和薄弱环节。而且,该课程缺乏相应的研讨课时,很难让学生对其所学知识进行深入思考和探究,以增强思辨能力和对课程的学习兴趣。⑷课程考核方式不够公平合理从考核方式上来说,该课程普遍采用“平时成绩”+“期末考试”的加权方式对学生成绩进行评定。平时成绩多由考勤分所得,期末考试多采用机考模式。这种考核方式过于单一化、机械化,无法对学生进行全方位的评价。很多学生来到教室打考勤,但可能根本没听讲,而是在睡觉或者玩手机。期末机考的公平合理性也是存在着很多的漏洞。例如机考的试题库可以十年不变,分值的分配和难度的掌握都没有经过系统的考量。甚至有的考试系统不够稳定和安全,频频爆出Bug,严重影响了考试结果的真实性。

2新人工智能环境下对计算机基础课程改革的具体方案

2012年开始,在随着卷积神经网络技术在视觉处理方面的应用取得巨大的成功之后,人工智能到达了有史以来的第三个爆发期。目前,深度学习技术在AlphaGo、无人驾驶汽车、机器翻译、智能助理、机器人、推荐系统等领域的发展如火如荼。与此同时,人工智能技术在教育领域方面的应用已经兴起。人工智能的教学产品也已有先例,例如基于MOOC平台研发的教学机器人MOOCBuddy等等。基于人工智能的教育是融合云计算、物联网、大数据、VR、区块链等新兴技术的增强型数字教育[2].在当前人工智能的大时代背景下,针对传统计算机基础的种种弊端,我们提出了如下教学改革方案。⑴改变教学理念,确立计算机基础课程的重要地位计算机基础作为高校的一门公共课,实则应当作为各个专业的学生后续的学习、科研的必修之课程。因此,高等学校应从源头上确立该课程的重要地位,将该课程纳入必修课范畴,并给与更充分合理的课时分配。除教学课时、实验课时之外,需要为该课程增加一定的研讨课时。任课老师必须是来自于计算机专业的人才。同时,定时举办关于该课程的教学培训、教学研讨会和教学比赛,改变教师的教学理念,从源头上给予该课程足够的重视。⑵优化教学内容,重新制定课程的教学知识体系教材是教师教学的主要依据,也是学生获得系统性知识的主要来源。因此,教材对于教学的重要性不言而喻。教材的选取需要优中择优,必要的时候可以根据自身院校的情况自己编写,力求使用好的教材使教学事半功倍。在选定优质教材的基础上,制定更加合理的教学大纲,优化计算机基础课程的教学知识体系,突出计算机学科入门相关基础理论知识的重要地位。对现有的过时内容进行更新,例如操作系统以Windows10的操作取代Windows7,Office这部分使用Office2019版本取代2010的版本,同时增加关于算法入门知识、程序设计入门知识以及人工智能、区块链等前沿知识单元的介绍。以华中师范大学为例,我们在图1中给出了该校计算机基础课程的教学知识体系结构图。⑶充分利用现代化的教学工具和人工智能技术,构建智慧课堂,改变传统教学模式现代化的教学应当转变以教师为核心的教学模式,更加突出学生的主体性地位。因此,在人工智能、物联网、大数据等技术和蓬勃发展的情形下,应当改变传统的课堂教学形式,充分利用现代化信息技术,将传统课堂教学和网络课堂教学模式相结合,构建智慧课堂。融合课堂教学身临其境的效果与网络课堂自主性强且方便师生交流的特点,通过师生之间多层次、立体化的互动,达到提升教学效果的目的。同时,建立功能强大、完善的学生实验平台,基于不同专业学生的不同特点和不同需求,进行个性化的作业设置。针对教师布置的实验任务和学生的完成情况,结合在线网络教学系统,通过传感器及网络数据,搜集学生的学习行为数据,并且使用人工智能算法进行智能分析,使教师对当前的学生的学习情况一目了然,并能引导学生对重点、难点的巩固和掌握。研讨课以学生为主体,按照所选课题进行分组调研、分组讨论,刺激学生的学习兴趣,培养其思辨能力。研讨内容最终可以课程论文的形式上交至课程共享平台,由教师和同学共同给出评分。这里,仍以华中师范大学为例,我们将在线教学系统、实验课平台、研讨课共享平台等集成为一个基于人工智能技术的网络智慧教学综合平台系统。该系统主要包括用户管理、在线教学、课堂互动、作业管理、考试管理、BBS系统、智能分析和平台管理8个模块,其主要功能如图2所示。该系统采用C/S模式,系统的服务器选用Linux服务器,同时开发基于PC机的和手机端的客户端系统,方便学生和教师随时选用、更加灵活。在线教学模块中的智能学习助理功能,能够根据历史用户的学习行为和当前用户的学习行为,自动地识别学习内容中的难点以及当前学生的难点内容,有针对性地对学生进行知识点强化。课堂互动模块中,通过可穿戴式传感器搜集学生的学习行为,用于后续智能分析模块中对学生的学习态度和学习行为进行智能分析。在线作业评价模块包括机器评价和教师评价两个功能。机器评价是系统为学生作业(客观题、主观题)自动评分,其中主观题的评分也是使用人工智能技术来实现。教师评分时可以参考机器评分,减少教师工作量。同时,教师评分为机器评分提供机器学习的经验数据,促进机器评分更加智能。智能分析模块能够依据学生的在线课程学习模块、课堂学习模块、作业管理模块等搜集到的学习行为数据进行综合分析,促使教师深入了解学生的学习情况和个性化特点,提升教学的针对性,并且有助于后续对学生进行全面、综合的分析和成绩评定。所有系统模块中使用到的智能分析技术包括基本的统计分析、以及各类机器学习算法(k-means,NaveBayes,SupportVectorMachine,DeepLearning等等)。⑷改变传统成绩考核的方式在“教学”+“实验”+“研讨课”课程结构以及网络智慧教学综合平台的辅助之下,学生的成绩评定更加全面化、多元化、公平化、自动化[7]。平时成绩中,除了教学综合平台的“课堂签到”次数之外,还增加更多丰富多元化的考察信息,如:学生的课堂讨论、在线课程学习和考核结果、平时作业完成情况,以及智能分析模块中辅助分析的学习态度、学习能力、平时成绩预测。期末上机考试系统也是智慧课堂综合平台的一个子模块,是精心设计的稳定、安全、功能强大的子系统,方便教师每一年更新试题库,修改bug。试题库中的每一套试卷都应当经过科学的考卷质量分析,使其难度、覆盖范围在一个均衡、合理的范围。最后,教师通过对各类平时成绩指标以及期末考试成绩加权,给出最终的学习成绩。通过规范、合理、公平、全面的考核体系,获得对学生公平、完善的评价机制,激励学生并刺激教学良性运转。

3结束语

相关期刊更多

数据采集与处理

北大期刊 审核时间1-3个月

中国科学技术协会

北华大学学报·自然科学版

统计源期刊 审核时间1-3个月

吉林省教育厅

遥测遥控

统计源期刊 审核时间1-3个月

中国航天科技集团有限公司