研究性学习的基本特征(6篇)

时间:2026-01-19

研究性学习的基本特征篇1

[关键词]本科生;学习力;评价体系

[中图分类号]G642.0[文献标识码]A[文章编号]1009―2234(2014)12―0167―02

1研究意义

怎样全面评价学生整体的学习效果,采取什么方法评价,都会对学生的学习力起到重要的影响。目前一般采取的方法比较单一,完全不能整体反映学生的学习状况,学生的综合学习能力和个人整体素质往往被忽视。因此,这与我国现行的高等教育为国家培养具有创新精神和实践能力的高素质人才目标有相当大的差距。而国外也已经有关于大学生学习力评价体系和方法的研究性理论成果。20世纪60年代末,美国的学者KennethA和TheodoreM对大学教育与学生的学习目的及评价的问题做了系统性的阐述,第一次打开了大学阶段学习评价实证性体系研究的先河。自那以来,美国以及西欧各国的研究学者、专家经过了30余年的研究,就该问题形成了一套成熟的理论体系,并在学生学习评价理论的基础上制定了各种评价手册,对在校大学生学习质量从不同方面进行了评估,以此来期望提高大学教育的质量。此后,这个问题也引起了日本学者的广泛关注。日本的学者借鉴美国研究者费尔德曼的高校对学生的影响力和爱斯坦因等的“I-E-O”评价模式,对大学生的学习动机、意识、学习态度以及学习习惯等各个方面进行了多年实证研究,并形成了初步研究结果。另外,他们还试图借助大学法人化改革为大学教学评价提供制度保障,其目的是使得这种改革在实践学习中更具可操作性。西方的学习评价理论比较有系统性,但是由于西方文化背景与国家体制的差异,相对我国国情的实际而言,仅仅只具有参考的作用。同时,我国国内在这方面的研究尚不多,而大多是对高等教育方法或高校管理的评价和评估。

因材施教是教育的起点。对于学生的学习力相关能力的相关评价,是开展针对性教育的基础。本科生学习力评价,可以能够充分展示学生对于学习力的内涵了解和诉求,如果能获得大数据样本并完成分析,完全可以针对某一个群体和个体进行有针对性的培养计划的制定。本文从学习力的研究意义作为研究起点,结合以往学者对于学习力的相关研究,提出适应本科生学习力评价体系的设计思想和设计原则,从而为后续的评价体系的科学构建打下基础

2学习力相关研究评述

学习,自古以来就是人类获得自身可持续发展的必要途径。学习的过程包括对知识的获取、消化和吸收过程,以及将学习到的知识转化为技能,甚至提升为能力和智慧的种种行为与表现,是将“知”和“行”不断统一的渐进过程。“学习力”最早出现在美国,1965年,由管理科学与工程领域的系统动力学理论的的奠基人-福瑞斯特教授在其出版的《一种新型的公司设计》中初次提及。

人在社会上的核心竞争力与学习能力密切相关。为了让学生更好的提升自身,对于高等教育阶段而言,知识的获取是必须的,另一方面,提高每个人的学习力更为重要。学生一旦从高中进高校学习,学习对象和学习方法面临着巨大的转变,迫切需要即使调整学习的角色、动态切换学习方法,尽早适应大学的学习生活。在此前提下,每个人的学习力的界定和评价就显得尤为重要。

近年来,国内学者纷纷就学生的学习力的内涵进行了不同的阐释,并形成了一系列的研究成果,如陈金国(2002)、吴高飞(2006)、陈莉平等(2006)、吴太胜(2006)、彭希林等(2007)、瞿静(2007)、周平良等(2007)、曾小军等(2008)、孙英(2008)、刘红英(2008)、应方淦(2008)、姚冬梅(2009)等学者对学习力的界定和评价进行了定性和定量分析。

结合国内外学者对学习力的研究成果,笔者从诸多的学习力的表现指标中,遴选出学习动力、学习能力、学习毅力、学习转化力和学习创新力作为学习力的具体体现,而学习力的评价将由五大要素的分别评价并加总而完成。下面将对本科生学习力评价体系的设计思想和设计原则进行分析。

3.本科生学习力评价体系的设计思想

评价体系的构建应该注意系统性原则。在一般情况下,若想全面体现学习力评价系统,应初次选取多个因素和指标特征,并进行科学性筛选。在此基础上,根据各种指标对本科生学习力评价系统的影响程度的大小,则可以根据从大到小,对初步问卷调研所得到的特征变量进行特征归集和归类,这就形成一个类似于树状的网络结构。目前,人力资源的绩效考核环节的若干评价体系都体现了该系统性思想。

4.本科生学习力评价体系的设计原则

本科生学习力评价系统的建立,必须从本科生学习力测算的科学性出发,同时注重与所在环境和氛围相结合,遵循客观、实用的原则,否则构建出的学习力评价系统就会失真,不具备实用性。

(1)科学性原则

科学性原则主要体现在本科生学习力评价的方法选择的科学性认定上。在设计本科生学习力评价系统时,首先要采用学术界所公认,同时较为成熟和完备的数学方法,这样建立的评价系统的认可度较强,理论上可靠。

本科生学习力是非常抽象的概念,其表现形式十分复杂,所以如何用后续研究所期待的评价系统对其学习力的实质进行归纳、总结和概括,是后续研究在筛选学习力内涵特征变量时需要反复思考的科学问题。

除此以外,在初次选择学习力内涵特征变量后,后续研究必须对全部的学习力特征变量进行涵义认定和分析,已防止在初选的特征变量中,出现“一词多义”现象,即避免涵义上的交叉。

(2)系统性原则

本科生学习力,具有广泛和高度概括的系统总结评价能力,并非若干个特征指标的简单归集和计算。在进行评价系统构建的时候,需要考虑评价系统构建的逻辑性和层次性。在本后续研究中,还是期待以Spencer兄弟对于胜任能力所界定的多个层次作为候选研究的起点,即先筛选指标,再对初选的指标进行层次分类。只有在借鉴成熟的绩效评价理论的基础上,将评价系统设计成若干分类和若干层级的综合系统,从而体现本科生学习力评价的系统性。

在选择出本科生学习力特征变量的基础上,后续研究适合采用层次分析法(即AHP法),该方法为系统性分析方法,先将初选的指标之间的相关关系进行测算,再计算得出相应权重,最后根据系统性原则完善树状结构的系统体系,同时使评价特征指标以及权重同时满足系统性原则。

(3)实用性原则

实用性原则是基于本科生的学习力评价体系的可操作性和可行性而必须兼顾的原则。前文已述,本科生学习力评价体系是为了整体和个体学生的因材施教,同时为高校的学风和教风建设提供服务,其实施效果不仅会影响到学生的进取心,而且会影响到教师和辅导员的教育效果。

学习力评价指标体系的设计,要在保证科学性和系统性的前提下,应该尽量尽量简化,方便教育教学一线的教师使用,做到可操作性强;另外,评价系统的理解和表述要通俗易懂。在实际操作中,在评价系统建立和实际应用过程中,尽量本着可视化目标,采用一定的程序和软件,将评价过程和结果简化。

(4)目标导向原则

本科生学习力评价,其根本目的是发现学生在学习能力培养上出现的问题并及时纠偏,同时引导和鼓励被评价的本科生整体和个人能够更好的提升自己的学习能力(特别是自学能力),这就决定了在构建评价指标体系时必须充分注意学习力评价的目标导向原则。

本科生学习力应该与高等院校的培养计划、学生个人的价值取向以及职业生涯规划保持整体一致。这就要求:在本科生学习力评价系统的构建中,要充分考虑到学生自身的性格特点以及价值观,对于不同的一级和二级指标给予的不同权重,从而引导学生未来的发展方向,从而实现教育和培养的目标导向。

5研究展望

学习力评价是学习系统的一种非常重要的反馈调节机制,在大学的学习与教学过程中都起着非常重要的作用,是高等教育人才培养方案中的一个不可或缺的微观环节。通过多种、不同类型的学习力评价,可以有效了解学生学习所达到的水平以及日常学习中存在的问题,从而实现学习评价力的反馈调节功能、学习诊断功能和激励功能。因此,为了对实现对本科生学习力进行定量判断和定性分析,本研究所期待建立的学习力内涵评价体系的尽量满足特征指标的定性判断,以及指标权重的定量测算相结合的全面考量。学习力评价由定性分析到定量计算的全面转变,是学习力内涵评价系统构建中的难点,也是本文后续期待的研究成果。

〔参考文献〕

〔1〕吴高飞.论学习力〔J〕.理论前沿,2006,(05).

〔2〕陈莉平,史丹双.基于学习力提升工商管理类专业人才的培养质量〔J〕.高教论坛,2006,(12).

〔3〕彭希林,周军铁,李苗.论学习力〔J〕.黑龙江教育:高教研究与评估,2007,(02).

〔4〕陈金国.学习型组织与企业发展战略选择〔J〕.煤炭企业管理,2002,(09).

〔5〕吴太胜.高职生学习动力系统及其校域调控与开发的路径选择〔J〕.职业技术教育,2006,(16).

〔6〕瞿静.论学习力理念从管理学向教育学领域的迁移〔J〕.体育成人教育学刊,2007,(04).

〔7〕曾小军,刘娟.大学生学习力现状及培育途径探析〔J〕.民办教育研究,2008,(08).

〔8〕孙英.学习力:高校核心竞争力之根本〔J〕.理工高教研究,2008,(08).

〔9〕刘红英.学习力:学习型社会的核心能力〔J〕.中国成人教育,2008,(15).

〔10〕姚冬梅.提升学习力:大学生可持续成长的支点〔J〕.职业时空,2009,(07).

〔11〕应方淦.论研究生学习力的培养〔J〕.学位与研究生教育,2008,(02).

〔12〕周平良,贾昌梅,黄新志.试论高职院校学生学习力的培养现状与对策探讨〔J〕.江西农业大学学报:社会科学版,2007,(12).

〔13〕〔美〕KennethAFeldman,TheodoreMNewcomb.TheImpactofCollegeonStudents〔M〕.NewYork:TransactionPublishers,NewBrunswickandLondon,2001.

研究性学习的基本特征篇2

关键词:间隔;分类学习;机器学习

中图分类号:TP39141文献标识码:A文章编号:2095-2163(2013)06-0044-04

0引言

在机器学习领域中,间隔扮演着重要的角色,可以用来度量分类器的置信度而其理论泛化界也可用于指导分类算法的设计。该理论已经广泛应用于特征选择、分类器构建、集成学习等领域。间隔的概念由Vapnik首次提出,并将其应用于构建支持向量机(SupportVectorMachine)[1]。支持向量机利用最大分类间隔来实现线性分类任务。1999年,Friedman指出间隔分布是用来指导分类集成学习构造稳定模型的重要度量[2]。随着间隔的泛化界的提出,从统计学习理论上解释了最大分类间隔实际意义。实际上,间隔思想表明如果在训练阶段模型能够产生大的间隔,那么分类任务将有好的置信度和高可靠性。在过去的十几年中,该理论在模式识别和机器学习领域引起了高度关注。

本文首先从特征选择、SVM分类器的构建和分类集成学习三个方法来阐述基于间隔方法的研究现状。在此基础上,给出了基于间隔分类学习中存在的问题并探讨其未来发展方向。

1基于间隔的特征选择方法的研究现状

近年来在机器学习领域,间隔作为代表性的特征评估策略之一已成为研究热点。间隔概念首次是由Vapnik提出为了构建SVM模型,这是用最大化类间的分类间隔来寻找最优可分超平面。1999年,ShaweTaylor和Cristianini在统计学习理论层面上证明了SVM中分类间隔是与其泛化误差的上界是紧密相关的[3]。2002年,Crammer等人讨论了Adaboost算法中的分类泛化误差,并指出其VC维与基分类器间的间隔分布相关,从而将间隔理论进一步推广到集成学习范畴[4]。2004年,GiladBachrach等人开发了两种基于间隔特征选择方法,并通过大间隔理论证明了这两种方法的最近邻无限样本泛化界[5]。因此,从统计学习理论角度来看,分类间隔可认为是一种用于衡量分类置信度的距离测度。近年来,大量基于间隔的特征选择方法正在相继不断地提出。根据其构造方式不同,间隔可分为两类。一类称之为样本间隔(SampleMargin),用于度量样本到分类边界的距离;另一类假设间隔(HypothesisMargin)则用来度量假设类别的距离。

研究中,可以将基于间隔的特征选择方法大体分为三类。第一类是通过直接最大化间隔来进行特征选择,如Relief[6]、Simba[5]等等。第二类是通过最小化分类间隔损失来获得搜索特征子集最佳的解决方案。2004年,Andrew等人提出了两种基于Logistic损失的特征选择方法并应用于SVM[7],其间分别采用了L1范数和L2范数正则化技术;实验结果显示使用L1范数正则化方法相对而言是比较有效的。2008年,Park等人提出了一种快速的特征选择方法[8],可利用Logistic损失来光滑近似Hinge损失并应用于支持向量机。2009年,Li等人提出了一种基于近邻规则的特征选择方法[9]。最后一类是利用间隔分类器的启发式的特征选择方法,其中最具代表性的当属SVM-RFE等算法。这三类方法中,第一和第二类方法是基于Filter模型的方法,而且均是独立于分类器的评估特征方法并且执行效率较高;但第三类方法的计算时间复杂性较高,从而限制其实用性。

2基于间隔的分类学习算法的研究现状

至今为止,支持向量机(SVM)作为大间隔的分类学习模型在机器学习领域备受关注。SVM的思想是要找到一个线性可分超平面,并使用最大间隔来正确地区分二类训练数据,如此即可有效地减少对测试样本分类错误的风险。这种SVM可将其称作硬间隔SVM。但是在训练阶段搜索最优超平面时,由于可分边界附近一些错分样本的影响,原有硬间隔SVM中最大间隔的原则将失效。为了解决上述问题,软间隔SVM利用松散阈值来得到一个近似线性可分超平面,实现了最大化间隔并最小化松散阈值的和来最优化学习模型的参数。对于线性不可分问题,核函数(KernalFunction)已经引入到SVM模型构建中并获得巨大成功。基于核函数映射的SVM是将原有的数据映射到一个高维特征空间中,并在其上构造最优分类超平面。

随着支持向量机研究的深入,对于训练抗噪声的SVM学习模型展开了广泛的讨论。1999年,LS-SVM获得提出[10],可利用平方Hinge损失来替换软间隔SVM中的Hinge损失来训练SVM。但在统计学习理论中,Hinge损失要比平方Hinge损失具有更好的鲁棒性和稀疏性。针对LS-SVM中的鲁棒性较差的问题WLS-SVM[11]也相继提出,利用了Hempel鲁棒估计获得平方损失的权值。2002年,Song等人利用样本到类别质心的平方距离来替代LS-SVM中的平方损失,从而构建了一种鲁棒的SVM,并将其应用到弹孔图像分类[12]。2006年,Xu等人将孤立点检测与大间隔理论相结合构造出一种斜坡损失来训练SVM,可以表达一个凸松弛损失训练问题并通过半定规划来求解[13]。2007年,Wu等人构造了一种截断的Hinge损失,通过对远离该类的异常样本用不敏感损失值来惩罚,从而使其获得较好鲁棒性和较少的支持向量[14]。2008年,Wang等人利用Huber损失来光滑文献[13]中斜坡损失,然后在原始空间中训练支持向量机,但其中需调优的参数过多,从而限制了其实用性[15]。2010年,Ma等人将中位数回归引入到Hinge损失中并得到了一种鲁棒的支持向量机[16],对于两类分类问题总的损失惩罚由两个属于不同类的中位数损失的和来衡量。此外,许多研究者将模糊粗糙集理论引入到SVM学习模型中来改善其鲁棒性,从而构建出许多模糊SVM模型(FSVM)[17-18]。这些研究的主要思想是通过计算样本附属于类别的隶属度来确定软间隔SVM中的Hinge损失对该样本的松散系数,由于隶属度较低的样本多为异常和噪声点,因此该模型可以有效改善噪声对SVM模型的不良影响。FSVM一个致命的缺陷在于不能够给出一个通用化的原则来确定样本的隶属度值即SVM损失项中样本的松散系数,而都是通过经验来选取模糊函数来计算隶属度。

3分类集成学习方法的研究现状

集成学习的思想是训练多个弱学习器,并将其相应结合后来进行决策或预测,从而改善单个学习模型的预测能力。集成学习的实质是对多个学习器的结合方式进行研究。近年来大量有关文献被发表,这些文献详细地讨论了集成方法的理论依据以及实现过程。在过去的几十年中,涌现了大量的集成学习算法。Boosting[19]是被最广泛使用的一种提高分类学习准确度的集成方法,可视作一个模型平均方法。Boost-in生一系列的样本子集来训练基分类,每次训练样本子集中由基分类器错分的样本将给其分配更高的权值,从而提高在下一次基分类器训练生成的训练样本子集中抽取该错分样本的概率。如此迭代下去产生多个基分类器,最终的分类结果将由多个基分类器加权融合而获得。1992年,Wolpert介绍了一种最小化泛化错误率的集成方法,被称作叠加法[20]。其思想是将基学习器分布在多个层次上,每一层中学习器的输出作为下一层的输入,利用多层的学习器来完成学习任务。1996年,Breiman提出了Bagging(BootstrapAggregation)集成方法[21]。Bagging最初是为决策树模型而设计的,但也可以使用在任何类型的分类或回归模型中。该方法通过Bootstrap采样从训练集中产生出多个训练子集,然后利用这些子集来分别训练一个基分类或回归模型。对于回归问题,Bagging的输出是多个回归模型预测值的平均;而对于分类问题则用投票法来决定样本的类别。1998年,Ho等人用随机子空间方法构建决策森林[22];在数据集中存在大量的特征时,该方法效果良好。Logitboost[23]是由Friedman等人提出一种Boosting算法,通过在分类器的迭代中使用Logistic回归模型来确定样本的权值,而获得了良好的效果。原因在于Logistic回归模型描述的是一个或多个因素之间的概率关系,对于Boosting算法而言迭代中样本的权值可以表示为一个概率形式。1999年,Schapire介绍了一种Boosting算法叫做AdaBoost[24],通过分析其泛化界解释Boosting算法的潜在理论。同年,Friedman将梯度思想[25]引入到Boosting学习中,在每个迭代中使用潜在损失函数的梯度为样本分配权值,由此设计出了一系列基于梯度的Boosting算法。之后,为了解决Adaboost算法对噪声数据较敏感问题,Freund等人提出了一种鲁棒的Boosting算法叫做Brownboost[26],该法利用无限水平近似技术来构造出一个鲁棒的损失函数,然后用其来计算在每次迭代过程中样本的权重。2003年,Kim等人分别用Bagging和Boosting来构建SVM分类集成系统[27],实验结果显示集成后的分类系统比传统的SVM分类方法具有更好的分类性能。2005年,Rosset等人提出了一种利用样本的权衰减函数来改善基于梯度的Boosting方法的鲁棒性,这个权衰减函数融入了Huber估计的思想[28]。2008年,Zhang等人提出了一个局部Boosting算法[29],这是一种基于重采样的AdaBoost方法,实验结果显示该算法比AdaBoost算法具有更好的稳健性。

对于集成学习结合方式的有效性,许多学者进行了讨论。1999年,Opitz等人比较了Bagging和两个Boosting算法[30](AdaBoost,Arching),比较后发现在一个低噪声环境下,Boosting分类性能优于Bagging,但Bagging的鲁棒性更强。2000年,Jain等人以一组分类器的结果如何结合改进总体分类精度为目标来讨论分类器组合方式问题[31]。研究者将这一问题针对不同的特征集,不同的训练样本集,不同的分类方法进行分析。实验结果显示对于相同的特征集,结合不同的分类器没有任何优势,但在不同特征集下构建出的分类系统却效果明显。同年,Kuncheva等人采用遗传算法设计了两个分类器融合系统[32],设计发现对于可能有重叠的特征子集,分类集成系统显现出良好的性能,但对于不相交的特征子集分类准确率却难以得到真正改善。2002年,Skurichina讨论了分类集成决策的稳定性问题[33],结果显示Bagging可以有效改善分类的稳定性。2007年,Anne等研究了基分类器的选择和融合方法对分类集成系统的影响问题[34],并得到一个重要的实验结论:选择各异的基分类器对提升分类集成系统的性能是有帮助的。

4大间隔分类学习存在的问题

目前,大间隔分类学习存在的主要问题有:

(1)噪声是普遍存在的,基于间隔的特征选择方法对噪声比较敏感,未来对基于间隔的特征选择方法的抗噪性研究是一个很好的研究方向。

(2)对于现有鲁棒的SVM分类学习方法而言,这些方法已经有效地解决了分类模型对噪声的影响,但其训练模型的时间复杂性较高,由此而限制了其实用性。这些问题,将有待于进一步研究。

5结束语

在机器学习领域中,间隔扮演着重要的角色,这是对分类置信度的一种刻画,可用于估计分类学习算法的泛化误差界和指导分类算法的设计。近年来,该理论已广泛应用于特征选择,分类器训练和集成学习。本文论述大间隔分类学习方法的研究现状,并给出了其存在的问题,为未来的研究有一定的指导意义。

参考文献:

[1]CORTESC,VAPNIKV.Support-vectornetworks[J].Machinelearning,1995,20(3):273–297.

[2]SCHAPIRERE,FREUNDY,BARTLETTP,etal.Boostingthemargin:anewexplanationfortheeffectivenessofvotingmethods[J].AnnalsofStatistics,1998,26:1651–1686.

[3]BARTLETTP,SHAWE-TAYLORJ.Generalizationperformanceofsupportvectormachinesandotherpatternclassifiers[J].AdvancesinKernelMethods—SupportVectorLearning,1999:43–54.

[4]CRAMMERK,GILADRB,NAVOTA,etal.MarginAnalysisoftheLvqAlgorithm[C]//Proceeding17thConferenceonNeuralInformationProcessingSystems,2002:462–469.

[5]GILAD-BACHRACHR,NAVOTA,TISHBYN.Marginbasedfeatureselection-theoryandalgorithms[C]//Proceedingsofthe21stInternationalConferenceonMachineLearning,2004:40–48.

[6]KONONENKOI,RUAND,FREUNDY.EstimatingattributesanalysisandextensionsofRELIEF[C]//ProceedingsofEuropeanConferenceMachineLearning,1994:171–182.

[7]ANDREWYN.FeatureselectionL1vs.L2regularization,androtationalinvariance[C]//Proceedingsofthe21stInternationalConferenceonMachineLearning,2004:171–182.

[8]PARKSY,LIUY.RobustpenalizedLogisticregressionwithtruncatedlossfunctions[J].CanadianJournalofStatistics,2011,39(2):300–323

[9]LIY,LUBL.Featureselectionbasedonloss-marginofnearestneighborclassification[J].PatternRecognition,2009,42:1914–1921.

[10]SUYKENSJ,VANDEWALLEJ.Leastsquaressupportvectormachineclassifiers[J].NeuralProcessingLetters,1999,9(3):293–300.

[11]SUYKENSJ,BRABANTERJ,LUKASL,etal.Weightedleastsquaressupportvectormachines:robustnessandsparseapproximation[J].Neurocomputing,2002,8:85–105.

[12]SONGQ,HUW,XIEW.RobustsupportvectormachinewithBulletHoleimageclassification[J].IEEETransactionsonSystems,Man,andCybernetics,PartC:ApplicationsandReviews,2002,32(4):440–448.

[13]XUL,CRAMMERK,SCHUURMANSD.Robustsupportvectormachinetrainingviaconvexoutlierablation[C]//Proceedingsofthe21stAmericanAssociationforArtificialIntelligence,2006:413–420.

[14]WUY,LIUYF.Robusttruncatedhingelosssupportvectormachines[J].IEEETransactionPatternAnalysisandMachineIntelligence,2007,102(479):974–983.

[15]WANGL,JIAAHD,LIJ.TrainingRobustsupportvectormachinewithsmoothramplossintheprimalspace[J].Neurocomputing,2008,71(479):3020–3025.

[16]MAYF,HUANGXL,WANGSN.Robustsupportvectormachineusingleastmedianlosspenalty[C]//Proceedingsofthe5thAnnualACMWorkshoponComputationalLearningTheory,2011:18–26.

[17]JIANGXF,ZHANGY,CHENGLJ.FuzzySVMwithanewfuzzymembershipfunction[J].NeuralComputing&Applications,2006,15(3-4):268–276.

[18]WUK,YAPKH.FuzzySVMforcontent-basedimageretrieval:ApseudolabelSupportVectorMachineframework[J].ComputationalIntelligenceMagazine,2006,1(2):10–16.

[19]GALARM,FERN’ANDEZA,BARRENECHEAE,etal.Areviewonensemblesfortheclassimbalanceproblem:bagging,boostingandhybrid-basedapproaches[J].IEEETransactionsonSystems,Man,andCybernetics,PartC:ApplicationsandReviews,2012,42(4):463–484.

[20]WOLPERTHD.Stackedgeneralization[J].NeuralNetworks,1992,5(2):241–259.

[21]BERIMENL.Baggingpredictors[J].MachineLearning,1996,24(2):123–140.

[22]HOTK.Therandomsubspacemethodforconstructingdecisionforests[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,1998,20(8):832–844.

[23]KOTSIANTISSB.LogitboostofsimpleBayesianclassifier[J].Informatica,2005,29(1):53–59.

[24]FREUNDY.ExperimentswithaNewBoostingAlgorithm[C]//Proceedingsofthe13thInternationalConferenceMachineLearning,1996:148–156.

[25]FRIEDMANJ.Greedyfunctionapproximation:agradientBoostingmachine[J].AnnalsofStatistics,2001,29(5):53–59.

[26]AnadaptiveversionoftheBoostbymajorityalgorithm[C]//Proceedingsofthe19thInternationalConf-erenceonMachineLearning,2001:293–318.

[27]KIMHC,PANGSN,JEHM,etal.Constructingsupportvectormachineensemble[J].PatternRecognition,2003,36(12):2757–2767.

[28]ROSSETS.RobustBoostinganditsrelationtobagging[C]//12thACMSIGKDDConferenceonKnow-ledgeDiscoveryandDataMining,2005:131–138.

[29]ZHANGCX,ZHANGJ.Alocalboostingalgorithmforsolvingclassificationproblems[J].ComputationalStatisticsandDataAnalysis,2008,52(4):1928–1941.

[30]OPITZDW,RICHARDM.Popularensemblemethods:Anempiricalstudy[J].JournalofArtificialIntell-igenceResearch,1999,11(4):169–198.

[31]JAINAK,ROBERTPW.Statisticalpatternrecognition:areview.[J].IEEETransactionsonPatternAn-alysisandMachineIntelligence,2005:131–138.

[32]KUNCHEVALI,JAINJ.ClassifierensembleswitharandomlinearOracle[J].IEEETransactionsonKnowledgeandDataEngineering,2007,19(4):500–508.

研究性学习的基本特征篇3

一、职业规划的基本概念

所谓职业规划(职业生涯设计),是指个人与组织结合,对其个体的主客观条件进行测定、分析、总结的基础上,对兴趣、爱好、能力、特点进行综合分析与权衡,同时结合火箭军需求,明确自身的职业倾向,确定其最佳的职业奋斗目标,并为实现这一目标提出行之有效的安排和计划。但这一计划的提出涉及到个体的喜好、擅长、价值原则、发展原则、岗位需求等诸多问题。要想我院学员在校期间通过自身努力确定这一规划是基本不可能的,他们缺乏大量的信息支撑,也无法获取最适合的决策方法,而在缺少上述条件和专家深度参与情况下做出的“确定性”支持是“可怕”的决策,这也使得我们需要通过研究负责任的为学员提出专业指导。

二、深度学习的基本概念

2006年,加拿大多伦多大学教授、机器学习领域的泰斗GeoffreyHinton在《科学》上提出深度学习主要观点:多隐层的人工神经网络具有优异的特征学习能力,学习得到的特征对数据有更本质的刻画,从而有利于可视化或分类;深度神经网络在训练上的难度,可以通过“逐层初始化”(layer-wisepre-training)来有效克服,逐层初始化可通过无监督学习实现的。从深度学习的基本概念不难看出其实质是通过构建多隐层的模型和海量训练数据(可为无标签数据),来学习更有用的特征,从而最终提升分类或预测的准确性。研究过程中“深度模型”是手段,“特征学习”是目的。深度学习理论与浅层学习理论的区别是:前者强调了模型结构的深度,通常有5-10多层的隐层节点如图1所示;明确突出了特征学习的重要性,通过逐层特征变换,将样本在原空间的特征表示变换到一个新特征空间,从而使分类或预测更加容易。与人工规则构造特征的方法相比,利用大数据来学习特征,更能够刻画数据的丰富内在信息。在职业规划的问题研究中关键是解决模型方面是否有其他更为有效且有理论依据的深度模型学习算法以及是否存在更有效的可并行训练算法。

三、士官职业规划的研究内容

根据优化人力资源配置,科学构建职业教育教学体系,加快推进我院职业教育创新发展,迫切需要开展士官职业规划问题研究。士官职业教育任务规划是提升教学效果的重要途径,按照把握目标定位、突出优势特色、反映士官特点、紧贴岗位需求的原则,研究士官职业规划问题,实现个人发展与院校教育任务有机衔接、相互融合,确保我院职业教育健康规范有序发展需要重点做好以下内容的研究。

1.士官学员职业规划的基本内涵和原则

(1)地方高等职业院校职业规划内涵

(2)士官学员职业规划比较性研究

着眼提升学员岗位履职能力和职业发展潜力,区分职业岗位,按照各级各类岗位能力标准要求,梳理岗位履职必备的核心知识和技能,以相关学科专业体系和任职教育课程体系为基础,开展士官学员职业规划比较性研究。

(3)确定士官学员职业规划的原则

既要借鉴国家有关职业资格标准规范,又要按照岗位任职需求,适应人力资源政策制度改革,围绕达到各级各类职业资格必备的核心知识能力,逐步开展学员职业规划问题研究。

2.士官职业规划信息反馈技术

(1)影响因素和能力分层

(2)能力识别

(3)基于深度学习的士官职业规划指导

3.深度学习常用模型研究

(1)稀疏自动编码器

(2)限制波尔兹曼机

(3)深度置信网络

(4)卷积神经网络

4.基于深度学习的士官职业规划关键技术

(1)样本收集与处理

(2)构造深度学习网络结构

(3)网络结构推导与实现

研究性学习的基本特征篇4

【关键词】研究性学习初中英语主动性

我国的第八次基础教育课程改革强调,学习方式的转变是课程改革的显著特征。转变学习方式从根本上就是从传统学习方式转向现代学习方式,“研究性学习”是现代学习方式之一,“研究性学习”是与“接受性学习”相对的一个概念,作为一种现代学习方式,“研究性学习”渗透于学生的所有学科,本人就谈谈在英语教学过程中如何体现和加强研究性学习。

一、强调研究性学习的主动性。

主动性是现代学习方式的首要特征,它对应于传统学习方式的被动性,二者在学生的具体学习活动中体现为“我要学”和“要我学”。“我要学”是基于学生对学习的一种内在需要,学生的内在需要一方面表现为学习兴趣,另一方面表现为学习责任。这两方面在课堂教学中我做过以下的尝试。在英语课堂上,每四五个人组成一个小组,通过小组成员一起讨论或分工合作开展以下主动性学习活动。

1.1开展学习竞赛

在学生之间、小组之间开展学习比赛,是调动学生学习积极性的有效手段。例如:英语课本剧比赛,学生根据所学的课文,发挥搞笑的才能,加以改编,内容可谓是五花八门,妙趣横生,这一形式非常受学生的欢迎。

1.2开展“我最喜欢的一句英语”的活动

鼓励学生在课外阅读的时候选择自己认为优美的句子记在摘抄本上,经常诵读,并推荐给全班同学。

1.3利用多种形式,激发学生学习兴趣

为了让大多数学生能够完成复述课文的任务,给学生以各种各样的提示或暗示,例如:图画、表格、关键词、文章框架等等。降低了难度,激发了学生的兴趣,培养了自信心。

1.4采用学生轮流值日汇报制度

用(Dailyreport)值日汇报的形式,鼓励学生将课文浓缩,改写课文(例如:以“I”为主语),续写课文,评选“最佳主持人”、每周‘名’星”等。

1.5起用部分学困生做老师的小助手

适当安排一些机会让学习较困难的学生做“老师的小助手”,让他们有成就感,激发他们的自动参与意识。

二、重视研究性学习的独立性。

独立性是现代学习方式的核心特征,它对应于传统学习方式的依赖性,如果说主动性表现为“我要学”,那么独立性则表现为“我能学”。实际上,每个学生都有相当强的潜力和潜在的独立学习能力。然而学生在学习过程中从来都是“教师先教,学生后学”。变“先教后学”为“先学后教”,这种学习方式充分表明了新课程改革下课堂教学的真正内涵和鲜活的生命张力。

三、发挥学生研究性学习的独特性。

独特性是现代学习方式的重要特征,独特性同时也意味着差异性,我们要尊重学生的差异,努力实现学生学习个体化和教师指导的针对性。这就是我们在教学过程中对每个学生的情况做到了如指掌,心中有数,在每个学习小组中需分配好、中、差生,针对不同层次的学生布置不同的预习练习,要让每一个学生都有成就感,能各有所得。

要充分地发挥学生的独特性,这就要求老师在备课时切实做好两个转变:一是由教师考虑“教什么”向考虑学生“学什么”的转变;二是由教师“怎么教”向学生“怎么学”转变,这样才能让程度好的学生能“吃饱”,程度中等的“吃得了”,程度差的学生知道“怎么吃”。

四、鼓励学生进行体验性的研究性学习。

体验性是现代学习方式的突出特征,在实际的研究性学习中,我经常鼓励学生带着教材走向生活,把教材中的知识通过实践来认识。英语是一门交际性语言,更需要通过实践来提高,鼓励学生在旅游时大胆地与老外交谈,在生活中见到的英语标牌或英语介绍,用心去体验,在不知不觉中运用英语,是学习英语的最好方法。

五、提倡问题性的研究性学习。

问题是科学研究的出发点,现代学习方式特别强调培养学生强烈的“质疑意识”,学问学问,要学就得问。“质疑”一方面强调通过问题来进行学习;另一方面通过学习来生成问题,把学习过程看成是发现问题,提出问题,分析问题和解决问题的过程。

在英语学习过程中,问题意识会激发学生强烈的学习愿望,从而注意力高度集中,积极主动地投入学习;问题意识还可以激发学生勇于探索,激发学生认识中的冲动性和思维的活跃性,更能激发学生的求异思维和创造思维。教师应提倡学生多“质疑”,绝不能批评学生提的问题与教材无关。

六、结束语

教学过程中的研究性学习,是教师根据教学内容设计相应的研究主题,或由学生提出问题,从而将研究性的学习渗透到提出假设,实践操作中去。因此,在教学中,教师要使教学过程中的发现、探究,研究等认识活动突显出来,使学习过程更多地成为学生发现问题、提出问题、分析问题、解决问题的过程,强调发现学习、探究学习、研究性学习,是我们教师在教学改革中的重要任务。

研究性学习的基本特征篇5

关键词:学生译员口译语料库口译教学

基于语料库的口译研究始于1998年,以色列Bar-llan大学的MariamShlesinger运用语料库方法,比较了同一源语文本的笔译语料库和口译语料的类符/形符比,词汇和句法特征,初步分析了口译语言特征。

在国内,胡开宝教授及其领导的团队于2009年创立了汉英会议口译语料库(CECIC)。该语料库现有库容230465词,其中,汉语源语文本为133341字,英译语料为97034词(胡开宝,陶庆,2010)。

迄今为止,国内外还没有一个专门针对口译学习者产出的口译练习文本而创建的口译学习者的语料库。口译学习者语料库的建立,能够客观地描述口译学习者口译译文。在口译研究中运用此语料库,能够有效避免传统的定性研究的主观性和片面性等缺陷。研究者和教师可以从众多学生口译现象或口译事实出发,在获取大量相关数据并进行统计分析的基础上,论证翻译共性的假设,阐明学习者口译语言的特征,学习者口译过程中语言转换的规律,以及学生译员采用的口译策略和方法,揭示口译认知过程的本质及口译活动的制衡因素,从而为建立科学的口译理论提供重要的实证物质前提。

口译学习者语料库构建的整个过程应包括前期准备,学习者口译译文语料收集,文本转写,文本清理,语料标注和语料库的生成。其中,建库前准备包括项目论证,工具设计与选择,教师与学生培训,取样(及确定样本)及先导研究。要在大规模收集语料前进行先导研究,此研究属于试验性研究,主要目的是检查调查工具,以及数据收集程序和语料库的建构方式的可行性。在此阶段,可以在收集几个学生口译译文文本的基础上,选取个别同学,进行先导建库实验。根据先导试验结果,再对调查工具和数据收集的过程进行改进,使人员配备、设备使用、收集方式和数据管理更趋优化合理。第二阶段包括制作语料库界面,并刻录成光盘。

为最大限度地保证科学性,在设计这些研究工具时,特别注意以下四条原则:1.最大限度采集学生的口译文本;2.简单实用,可操作性强;3.稳定性和可重复性;4.灵活性和适用性。

口译学习者语料库有助于研究学生译员的口译策略、口译语言特征、口译规范和口译过程,用学生译员口译语料库的进行口译教学的可行性包括:

首先,该语料库的建立能极大方便口译课堂教学实践,并对英语口译科研产生借鉴和参考意义。教师在进行课堂进行词汇具体用法教学时,可以将目的词汇所有学生的用法、意义和搭配同时展示给学生看,分析其正确与错误性,展示真正的学生的语言能力、语用能力和交际能力情况,分析学生的翻译错误的种类、特征和频率,有助于对学生学习效果进行评估。

其次,教师可以开展学生的口译语言特征研究,基于学生的口译译文语料,通过比较其他的会议口译语料和相同题材的英文或汉语原创语料,可以系统分析学生口译中的语法与词汇的显化和隐化现象、简化和范化现象,常用逻辑关系连接词,分析译文的语域特征,修辞虚词,并列句及复合句等。

再次,口译教师可以利用Wordsmith2.0或AntConc及词汇研究软件Range,对可以检查该语料库学生译员使用的词汇覆盖范围,类符、词次比(TTR),标准类符、词次比(STTR),句子及译文的句子平均长度,关键词的复现率及关键词密度等方面的用途和价值等项指标进行量化测试和统计,给出具体数据,以此对所教学生的口译译文进行量化评估,评价其是否充分掌握了口译的教学目标,有助于了解学生的口译和大纲的吻合程度,避免实际运用能力和大纲要求的能力的脱离,适时更正或补充一些翻译方法及技巧。

基于该语料库还可以对于跨文化交际现象进行批量检索和定性研究,学生可以运用AntConc3.2.0,利用关键词搜索和探针式收缩,对其concordance(语境共现),fileview(文本观察),plot(词图分布),cluster(词簇),collocation(搭配)等功能进行分析,教师可以观察并量化学生的跨文化交际能力。

最后,口译语料库数据还能为基于口译统计的各种语言建模、分析提供必要的训练数据。

参考文献:

[1]胡开宝,陶庆.汉英会议口译语料库的创建及应用研究.中国翻译,2010:49-56.

[2]胡奕悦.基于语料库的汉英会议口译句法操作规范研究.上海交通大学硕士学位论文,2010.

研究性学习的基本特征篇6

目前,社会正处于一个微博崛起的时代,一切有关于微博的问题都被社会广泛关注,并得到了工业界和学术界的高度重视。微博从出现以来,取得了良好的发展,并拥有大众的普遍关注和应用。微博的超大信息量和高速度的更新等,都是值得研究的话题。同时,微博处理自然语言已经成为当前最新型和热门的研究课题,而其中最值的探讨的热点课题就是中文微博情感分析。

【关键词】词典机器学习中文微博情感分析

在当前众多社交网络平台中,微博以新型的信息手段具有重要的社会影响力。根据我国相关数据统计可以发现,我国微博用户使用量已经高达3.5亿,并处于逐年上升的趋势,占全国网络居民中的百分之五十。微博情感分析是按照主观倾向性将微博文本分为三类:第一是正向;第二是负向;第三是中性。

1情感的分析方法

目前,主要通过两种技术来对情感进行分析。第一类是根据情感词典来进行,微博文本中所包含的正向情感词和负向情感词都通过情感词典来进行统计分析,而文本的情感极性则依靠所取得的差值来决定。第二类是机器学习的使用方法,对测试预料和训练词进行相关的标注,再使用分类器对情感进行分析,其中分类器包括有:

(1)KNN;

(2)最大熵;

(3)支持向量机等。

另外,Wang与相关研究人员对Twitter情感分析系统进行了构建,其能对相关评论信息的情感倾向性进行较为实时的分析。Agarwal与相关人员通过对极性词语的特征研究,对微博文本通过树内核模进行了情感分类研究,其也获得了一定的成绩。Jiang及其成员对微博文本的情感分析使用了主题无关和主题相关的方式进行了分类,一种是正向情感,一种是负向情感。

与英文微博相比,中文微博具有很大差异,其中主题较为发散是中文微博的主要特点,且内容十分繁杂丰富,并与英文微博的行文习惯也有很大区别。因此,部分研究人员通过多种计算方法对微博的情感分析进行了全方位的分析,其中所包括的算法有:

(1)三种特征选择方法;

(2)三种及其学习算法;

(3)三种特征权重计算方法,但该方法对微博文本的行文特点并没有考虑到位,导致在整条微博中,微博表情符号直接影响了文本的情感极性。

同时,其他研究人员提出了微博情感分析的层次结构分析方法,但由于表情符号的规则原因,其有了提高分类效果的作用,但却使微博文本中的极性信息被忽视。由于中文微博主题发散和内容简短,以及不规范的用语和未登录词较多等问题,使中文微博文本目前的情感分析效果未取得一定的进展。由于词典方法和及其学习方法都存在各自的问题,针对中文微博的文本内容简短、口语化国多和主题不集中等特点,提出了有关于结合词典和机器学习的方法,以对中文微博情感进行更为准确的研究。

2基于词典与机器学习的中文微博情感分析

基于中文微博的特点研究,采用词典与机器学习相结合的方式,进一步分析研究中文微博文本的情感倾向性。

2.1特征降维

经过分析微博文本可以看出,其中的形容词和动词是最主要的情感词语,也能够准确反映文本情感的倾向性,所以特征的选择应当主要以形容词和动词为主。微博文本中所包含的所有形容词和动词都被特征空间所集合包含,当产生较大训练文本集时,则具有非常高维数的特征空间。同时,中文微博中还较频繁出现表情符号,并还含有多个词或是十多个词,使绝大多数维上的值在特征向量中显示为0,导致数据稀疏性的问题出现在特征空间中,所以,必须使用降维来对特征空间进行缓解。

常用的特征降维方法有两种:

(1)特征选择;

(2)特征抽取。

但特征抽取具有大计算量和储存方面的问题,对于处理文本具有一定的局限。特征选择在性能方面十分良好,通过特征降维的统计法后,依然出现特征空间的严重数据稀疏性问题,则需进一步对特征空间进行降维操作。在聚类词语方面,层次聚类算法具有明显的作用。所以,可以采取统计法融合层次聚类算法的层次结构来实现降维。特征选择在进行统计法后,可以对特征空间进行初步的维数降低,并依靠层次聚类算法实现特征空间的有效降维,保证特征空间维数的进一步降低,最终实现特征降维的有效目的。

2.2特征极性值

中文微博中的修饰词和情感词所构成的极性值短语为极性特征的极性值。绝对值越大的极性值,具有越强的情感极性,反之越小的绝对值,其情感极性越弱。在微博文本中可以出现很多次同一个极性特征,每出现一次,则极性副词彼此之间都有不同的顺序,也导致每次的极性值计算都有所差异。所以,该极性特征可以通过极性值的平均算数值来作为最终极性值。中文微博中的评论性所使用的符号表情,对于本人的立场和情感都有真实的反应和重要作用,能使该条文本的情感极性进一步增强。如果在微博文本中,正向极性特征的极性值在微博文本中得到加强,那其正向表情符号肯定超过负向表情符号的有效数目。相反,如果负向极性特征的极性值出现减弱,则微博文本中的负向表情符号肯定大于正向表情符号的有效数目。中性特征的极性值在正常情况下应当为0,但为了实现和出现次数为0的特征项目进行区别,可以对中性特征的极性值设置一个小的公式设计。

3结束语

总之,本文对词典与机器学习的中文微博情感分析方法进行了探讨,并根据中文微博的相关特点,对层次结构的降维方法进行理论探讨。同时,随着网络信息的逐步发展,中文微博中还在不断产生一些新鲜的词汇,导致其无法被当前的分词系统进行有效识别,对分类中文微博情感造成了一定的阻碍,所以,未来还应不断尝试新的分类方法来对其进行识别匹配。

参考文献

[1]孙建旺,吕学强,张雷瀚.基于词典与机器学习的中文微博情感分析研究[J].计算机应用与软件,2014(07):177-181.

[2]孙晓,叶嘉麒,龙润田,任福继.基于情感语义词典与PAD模型的中文微博情感分析[J].山西大学学报(自然科学版),2014(04):580-587.

[3]张庆庆,刘西林.基于机器学习的中文微博情感分类研究[J].未来与发展,2015(04):59-63.

更多范文

热门推荐