首页 | 小学 | 初中 | 高中 | 作文 | 英语 | 幼教 | 综合 | 早知道 |
学习方法 当前位置:唯才教育网 > 初中 > 学习方法 > 正文 唯才教育网手机站

核方法与累积量随机学习方法研究

时间:2016-04-13 来源:唯才教育网 本文已影响

篇一:核方法的算法实现

核方法的算法实现[1,9,10]

根据核方法的思想, 对于非线性分类, 首先采用一个非线性映射φ把数据映射到一个高维特征空间, 然后在高维特征空间中进行线性分类, 映回到原空间后就成了输入空间中的线性分类。为了避免高维空间中的复杂计算, 采用一个核函数K(x,y)代替高维空间中的内积运算<φ(x).φ(y)>。

核函数方法的特点

核函数方法的广泛应用,与其特点是分不开的:

1) 核函数的引入避免了“维数灾难”,大大减小了计算量. 而输入空间的维数n 对核函数矩阵无影响,因此,核函数方法可以有效处理高维输入.

2) 无需知道非线性变换函数Φ的形式和参数.

3) 核函数的形式和参数的变化会隐式地改变从输入空间到特征空间的映射, 进而对特征空间的性质产生影响,最终改变各种核函数方法的性能.

4) 核函数方法可以和不同的算法相结合,形成多种不同的基于核函数技术的方法, 且这两部分的设计可以单独进行,并可以为不同的应用选择不同的核函数和算法.

核函数方法实施步骤

核函数方法是一种模块化(Modularity) 方法,它可分为核函数设计和算法设计两个部分

核函数方法的实施步骤,可以具体的描述为:

1) 收集和整理样本,并进行标准化;

2) 选择或构造核函数;

3) 用核函数将样本变换成为核函数矩阵,这一步相当于将输入数据通过非线性函数映射到高维

特征空间;

4) 在特征空间对核函数矩阵实施各种线性算法;

5) 得到输入空间中的非线性模型.

显然,将样本数据核化成核函数矩阵是核函数

方法中的关键. 注意到核函数矩阵是l ×l 的对称矩阵,其中l 为样本数.

几种常用的核函数方法

函数方法可以分为两类,一类是新开发的方法,如SVMs ;另一类是用核函数改造传统线性算法得到的一类非线性方法, 如核化学计量法. 由于SVMs 是统计学习理论中具有突破性的、最重要的、应用最广泛的基于核函数的学习算法,因此直到目前为止,多数文献中提到的核函数方法仍然是指SVMs. 文中核函数方法是指所有采用了式(1) 核函数技术的方法.

SVMs 的成功得益于结构风险最小化(St ruct ural Risk Minimization , SRM) 的思想[ 8 ] 和核函数技术的应用.

核函数方法的研究现状

核函数方法中模型选择十分重要,模型选择包括核函数的选择、构造以及参数调整[1 ,15 ] ;就SVMs而言,还包括容量控制参数(正则化参数) 、损失函数的确定等;而对另一类通过“核化”线性方法得到的核函数方法,原来模型中的参数仍需要确定. 如核化学计量法,就要确定非线性主元数和回归系数等参数. 由于核函数方法的设计可以分成核函数设计与算法设计,将这两部分模型的选择分开进行可以使问题简化,这是目前许多讨论模型选择问题的文献所采用的策略.

结 语

模型选择一直是核函数方法研究的重点,虽然目前在不同的应用研究中提出了一些针对样本特征的核函数构造方法,但还缺乏系统化的方法,以及如何评价针对同样的问题采用不同核函数而得到的核函数矩阵的性能. 如果能在这方面取得突破,则必将大大推进核函数方法的理论和应用水平;其次,在任务相关核函数的构造方面的研究多数集中在针对模式识别问题,针对回归核函数模型的模型选择研究较少. 这些都是未来核函数方法研究值得重视和加强的.

核函数发展历史

早在1964年Aizermann等在势函数方法的研究中就将该技术引入到机器学习领域,但是直到1992年Vapnik等利用该技术成功地将线性SVMs推广到非线性SVMs时其潜力才得以充分挖掘。而核函数的理论则更为古老,Mercer定理可以追溯到1909年,再生核希尔伯特空间(ReproducingKernel Hilbert Space, RKHS)研究是在20世纪40年代开始的。

核函数在模式识别中的应用

1)新方法。主要用在基于结构风险最小化(Structural Risk Minimization,SRM)的SVM中。

2)传统方法改造。如核主元分析(kernel PCA)、核主元回归(kernel PCR)、核部分最小二乘法(kernel PLS)、核Fisher判别分析(Kernel Fisher Discriminator, KFD)、核独立主元分析(Kernel Independent Component Analysis,KICA)等,这些方法在模式识别等不同领域的应用中都表现了很好的性能。

篇二:一种有效的解图匹配问题的核方法研究 2

一种有效的解图匹配问题的核方法研究?

摘要:随着计算机技术与网络技术的高速发展,大量的数据充斥着我们周围的世界。面对这些复杂的海量数据,如何才能准确无误地对它们进行辨别与分析,这对于人们来说是一个非常具有挑战性的问题。在计算机领域,图是一种非常灵活的数据结构,对图等含有结构化信息数据的进行学习,是模式识别和机器学习领域的一种重要问题。本文主要研究了通过核方法来解决这些识别问题,并且实例化了两种特殊的解决图匹配的核方法。在此基础上,分析了其解决这类问题的算法复杂度。实验结果表明,本文所提出的方法是一种解决图匹配的非常有效技术。 关键词:模式识别;图数据;图匹配;核方法

1引言

模式识别伴随着计算机技术和网络技术的快速发展,在许多领域得到了成功应用如数据挖掘、文献分类、财政、多媒体数据库的组织和检索、生物(比如根据人的物理特征,如人脸、指纹等识别人)、医学(医学图像分析)。其中图的顶点表示对象的各个组成部分,图的边表示各组成部分之间的关系,以这样的表达方式图就可以很容易地捕捉到物体的关系与结构信息。因此,基于图的描述是一种非常有效的表达方式。而当前模式识别领域中大多数工具却不能直接以图为其处理对象,这严重影响了基于图方法的发展。研究复杂模式分析和分类方法是有必要而且有意义的。其中基于核方法的学习方法是一种比较新的学习方法,它是从统计学习理论中发展出来的,并且有效地克服了传统模式识别方法的局部极小化和不完全统计分析的缺点。

现实世界中的数据往往具有数据量多、高维、动态、不完全(缺值)、不确定(包含噪声)以及稀疏性等特性。对于从事模式识别、信号处理以及数据挖掘的研究者来说,核方法是一个强有力的分析工具。本文主要研究并实例化了一种核方法来模式识别中的图匹配问题,也就是通过在一个图中匹配另一个图中的某个相似的子结构来计算两个图的相似性的过程。 2核方法

在近几年的机器学习和数据挖掘领域中,核方法成为一种非线性数据处理的新方法。它避免了神经网络和决策树中典型的局部极小化问题和过拟合问题。因此,它可以看成是经典线性方法的扩展,也可以认为它等效于使用非线性映射将样本变换到希尔伯特特征空间,随后在该空间中实施线性特征抽取的方案。

定义2.1(图核)图G1和G2间的核函数K (G1, G2)称为图核。映射? 将原始空间中的图映射到高维甚至无穷维向量空间(特征空间)中去,使得

K (G1, G2) = <? (G1), ? (G2)>

由于映射 ? 的选取,如 ?(G)的分量可以是两图中某一公共子路径的条数等,核k :G × G→R可以看成是两个图G1和G2间的相似性度量。

核方法作为一种非线性方法可以解决这些问题。这将使得原来用于向量表示的标准算法也适合图,它可以把统计模式识别和结构模式识别有机地结合起来。

3图核

一般常见的图核可分为三大类:基于路径的核方法如随机游走核、最短路径核;基于有限规模子图的核方法;基于树模式的核方法如树模式图核、快速子树核、Weisfeiler-Lehman图核等。本节重点深入研究快速子树核和Weisfeiler-Lehman图核及其在解决图匹配问题时的算法复杂程度。

定义3.1(快速子树核))图G和图G’之间快速子树核

(h)kramon(G,G')???kh(v,v')

v?vv'?v'

通过分析比较,两图之间的快速子树核的计算复杂度是O(n

对的比较和在O(4d2h4d),其中包括n2个节点)范围之内,邻居节点的所有匹配次数。重复h次,其中h是一个多分类因子而不是指数。以k1为起是点,经过kh-1到kh递归地计算子树核。

定义3. 2(Weisfeiler-Lehman图核)图G和图G’之间的WL图核定义为 (h)kWL(G,G')?(si(v),si(v'))|f(si(v))?f(si(v')),i{0,...,h},v?V,v?V'

其中Si(v)为节点v在第i次迭代中的多分类标签集,f是一个映射标签压缩函数,对于所有的i?j,集合?f(si(v))|v?V?V'?和集合f(sj(v))|v?V?V'是不相交的。S0(v)是在标签图v和非标签图中的初始标签并且f(s0(v))?s0(v)。

4实验论证

4.1数据准备 ??

实验数据集主要包括MUTAG, NCI1,NCI109,ENZYMES,D&D。其中MUTAG是一个根据是否对革兰氏阴性菌鼠伤寒沙门氏菌有突变作用的含有188个突变芳香和杂环硝基化合物。NCI1和NCI109分别代表两组平衡的化学混合物数据集,它们来自于非小细胞肺癌细胞和卵巢癌细胞系。ENZYMES 是一个具有三层结构的蛋白质数据集,它包含从酶蛋白质数据库中获取的600个蛋白质酶。这种情况下的主要任务是正确给每个蛋白质添加一个6层结

构的类。D&D是一个包含有1178个蛋白质结构的数据集。每一个蛋白质可以看作一个图,图中的节点表示氨基酸,两个节点之间的边小于埃则可以用一条边连接。所有节点在数据集中是被标记的,预测的任务则是区分蛋白质结构中的酶与非酶。

数据集中节点数、边数和度数的分布表4.1所示

4.2仿真实验

图是一种特殊的结构化数据表达形式,许多经典的学习算法不能用于图形数据的分析。因此,本实验主要围绕对图形数据的分析展开寻找适合图形数据后续分析的向量表示方法,以扩大传统学习算法在图形数据中的应用。实验硬件环境是Intel Core 2 双核CPU 2.2GH,内存2G。软件环境是美国The Math Works公司推出的Matlab软件,其中支持向量机SVM的实现采用的是Libsvm工具箱。实验方法采用十倍交叉进行,其结果如下图所示

图4.2 快速子树核与Weisfeiler-Lehman图核的分类精度与运行时间

5 结束语

本文针对模式识别中的图匹配问题,主要研究了通过核方法来解决现实世界中的模式识别与分类问题。接着对两种图核的实例快速子树和与Weisfeiler-Lehman图核进行深入深入研

究和分析外,着重探讨了其在解决大规模、复杂、高维数据上所具有的优越性。从实验结果可以看出,这两种图核解决模式识别问题时具有的高效特点,且Weisfeiler-Lehman图核比快速子树具有更优的匹配精度和更少的运行时间。随着经济社会的高速发展,在生物、数据挖掘领域越来越多的图数据(如分子结构、蛋白质交叉网络)变得越来越多。核方法将会受到更多学者们的青睐,希望今后能构造出分类精度更高效果更好的图核来解决其他领域中的分类和识别问题。

参考文献:

[1] N. Shervashidze, K. Borgwardt. Fast subtree kernels on graphs. In Neural Information Processing Systems, 2009.

[2] JOHN S T, NELLO C. Kernel methods for pattern analysis[M]. China machine press,2005.

[3] DUCHENNE O, BACH F, KWEON I, PONCE J. A tensor-based algorithm for high-order graph matching [C]. International

Conference on Computer Vision and Pattern Recognition, 2006.

[4] Jones L.K. A simple lemma on greedy approximation in Hilbert space and convergence rates for projection pursuit regression and

neural network training. The Annals of Statistics, 1992, 20: 608-613.

[5] B.Moayer and K.Fu. A tree system approach for fingerprint pattern recognition[J]. Pattern Recognition, 1990,23(8):893-904.

[6] 历小润. 模式识别核方法研究[D].2009

[7] Gurney K. Introduction to neural networks. UCL Press, London,1997.

[8] 焦李成. 神经网络系统理论.西安电子科技大学出版社,1996.

[9] 牟少敏. 核方法的研究及其应用.北京交通大学博士论文,2008.

[10] 郑永涛,刘玉树. 支持向量机解决多类问题研究[J]计算机工程与应用,2005.23

篇三:几种图匹配的核方法研究

几种图匹配的核方法研究

摘要:数据挖掘算法现面临挑战,这个挑战就是要处理日益增长的复杂对象。对于图数据,随机游走核是有力的容错图匹配方法。由于随机游走核的局部定义,它的适用性取决于潜在图表示的特性。另外通过定义图实例的核函数,数据挖掘算法的整个工具变得可用。迄今为止,已经提出了基于图的游走、子树和循环的图核。一般问题在于,这些核要么运算量大要么受限于他们的表达性。我们试着通过定义基于路径有表达性的图核克服这个问题。由于计算图的所有路径和最长路径是np-难,我们建议基于最短路径图核。这些核在多项式时间内就可以计算,保持表现力并且仍然是正定的。

关键词:np-难;图核;核方法;随机游走核;最短路径核;正定 中图分类号:tp391.4 文献标识码:a 文章编号:1009-3044(2013)07-1622-04

1 概述

核方法是统计学习理论[18]的流行方法,它在数据挖掘上有多种应用。核可以完成比如分类这样的任务,这些任务以非线性假设和很种不同数据类型的支撑向量机、回归[5]、聚类[1]和主成分分析

[19]来完成。

核方法的早期研究几乎都只处理基于向量描述的输入数据。

haussler[10]第一个定义了在结构对象上用原则性方法设计核,也就是所谓的r-卷积核。卷积核的基本想法是定义复合对象子结构正

篇四:高阶统计量方法及应用研究

高阶统计量方法及应用研究

高阶统计量方法是近几年国内外信号处理领域内的一个前沿课题,它包含了二阶统计量没有的大量丰富信息,广泛应用于所有需要考虑非高斯性、非最小相位、有色噪声、非线性或循环平稳性的各类问题中。凡是使用功率谱或相关函数进行分析与处理,而又未得到满意结果的任何问题都值得重新使用高阶统计量方法。高阶统计量的发展与应用是信号处理领域近年来一个十分重要的发展,是现代信号处理的核心内容之一。

1 国内外研究应用现状及发展趋势

高阶统计量方法是近几年国内外信号处理领域内的一个前沿课题。高阶统计量广泛应用于所有需要考虑非高斯性、非最小相位、有色噪声、非线性或循环平稳性的各类问题中。其研究内容包括高阶统计量、非参数化高阶谱分析、因果和非因果非最小相位系统的辨识、自适应估计和滤波、信号重构、信号检测、谐波恢复、多元时间序列分析、时变非高斯信号的时频分析、阵列处理、循环平稳时间序列分析以及其他专题(时延估计、盲反卷积和盲均衡、多维高斯信号)。

在信号处理领域,人们常常习惯于假设信号或噪声服从高斯分布,从而仅用二阶统计量便可提取信息,进行参数辨识以及各种处理。但是,高斯分布只是许多分布类型中的一种,非高斯信号才是更普遍的信号。对非高斯信号来说,二阶统计量只是其中一种信息,它不包含相位信息,因此对非最小相位系统的辨识而言,二阶统计量便显得无能为力。在实际工作中,常常面临大量非高斯、非最小相位、非因果、非平稳信号的处理问题。利用高阶统计量辨识解决这些问题的主要手段,高阶统计量提供了前所未有的十分丰富的信息,使我们可辨识非因果、非最小相位、非线性系统可以抑制高斯或非高斯的有色噪声可以抽取不同于高斯信号的多种信号特征可以分析与处理循环平稳信号等等。高阶统计量是现代信号处理的核心内容之一。 人们对高阶统计量的研究已有近几十年的历史,虽然早在 年代初许多领域的研究人员就开始了对高阶统计量的研究,但是真正的研究高潮却是在 年代后期,经过短短几年的迅速发展,高阶统计量已在雷达、声纳、通信、海洋学、天文学、电磁学、等离子体、结晶学、地球物理、生物医学、故障诊断、振动分析、流体动力学等领域获得了广泛的应用。 在国内,高阶统计量的研究起步于 年代中后期,但进展比较快。现在有许多科研工作者和工程技术人员对在信号处理、系统理论和时间序列分析等领域表现出浓厚的兴趣。随着越来越多的人对高阶统计量的研究深人,高阶统计量必将在我国得到广泛的应用与发展。 2 高阶统计量的特点方法及应用范围高阶统计量方法与一、二阶统计量方法相比有如下特点 二阶统计量进行信号分析时,假设信号或噪声服从高斯分布,从而仅用二阶统计量便可提取信息,进行参数辨识以及各种处理。对非高斯信号来说,二阶统计量只是其中一种信息,它不包含相位信息,因此对非最小相位系统的辨识而言,二阶统计量便显得无能为力。

高阶统计量之所以大大超越功率谱和相关函数,道理很简单高阶统计量包含了二阶统计量没有的大量丰富信息。高阶统计量不仅可以自动抑制高斯有色噪声的影响,而且有时也能抑制非高斯有色噪声的影响高阶循环统计量则能自动抑制任何平稳高斯与非高斯噪声的影响。可以毫不夸张的说,凡是使用功率谱或相关函数进行分析与处理,而又未得到满足结果的任何间题都值得重新使用高阶统计量方法。

任何高斯过程的高阶累积量均等于零,这一事实使得用高阶累积量作为数学工具在理论上可完全抑制高斯有色噪声的影响。

2.1 一、二阶统计量方法应用范围

一、二阶统计量进行信号分析时,假设信号或噪声服从高斯分布,对非高斯信号来说,二阶统计量只是其中一种信息。一阶统计量反映随机变量的集中位置,二阶统计量可描述随机过

程在两个不同时刻状态之间的线性依从关系。

高阶统计量方法应用范围

近二十年来,高阶累积量与多谱已获得广泛应用。高阶统计量广泛应用于所有需要考虑非高斯性、非最小相位、有色噪声、非线性或循环平稳性的各类问题中。

3 高阶统计量定义及信号特征的提取

所谓高阶统计量,通常应理解为高阶矩、高阶累积量以及它们的谱——高阶矩谱和高阶累积量谱这四种主要统计量(此外,还有倒高阶累积量谱即倒多谱)。高阶矩和高阶累积量是利用其特征函数来定义的。然后引出高阶矩谱和高阶累积量谱的定义。

3.1 随机变量的高阶矩和高阶累积量的定义

对于 维随机变量?x1,x2?xn?定义其联合特征函数为

定义其第二联合特征函数为

可见,联合特征函数???1,?2??n?就是n维随机变量?x1,x2?xn?的联合概率密度函数f?x1,x2?xn?的n维傅里叶变换。

对上面两式分别按泰勒级数展开,则阶数r=k1+k2+…+kn的联合矩可用联合特征函数定义如下:

同样的,阶数r=k1+k2+…+kn的联合累积量可用第二特征函函数定义为

3.2随机变量的高阶矩谱和高阶累积量谱的定义

假定高阶矩mkx??1,?2??k?1?一是绝对可和的,即

则k阶矩谱定义为k阶矩的k-1维傅里叶变换,即

假定高阶累积量Ckx??1,?2??k?1?是绝对可和的,即

则k阶谱定义为k阶累积量的k-1维离散傅里叶变换,即

高阶谱又叫多谱或累积量谱。特别地,三阶谱S3X??1,?2?叫双谱,而四阶谱S4x??1,?2,?3?称为三谱。

(3)它们各自提取信号的特点

高斯随机变量x的一阶累积量和二阶累积量恰好分别是的均值和方差;

高斯随机变量x的高阶矩只取决于二阶矩?,并不比二阶矩多提供信息,其信息是冗余的; 高斯随机变量x的高阶累积量Ck?k?2?恒等于零。高阶累积量对高斯过程不敏感。因此,当加性噪声是高斯有色噪声时,高阶累积量在理论上可完全抑制噪声的影响高阶矩不具备这一性质。因此我们使用高阶累积量而不是高阶矩作为主要的分析工具。

高阶白噪声的高阶累积量是多维冲击函数,该噪声的多谱是多维平坦的。这使得我们很容易建立非高斯信号与线性系统传递函数之间的关系。但是高阶白噪声的高阶矩及其谱却无此优点。

功率谱所包含的信息基本上是在自相关函数中所包含有的信息,这对于一高斯过程的完全统计描述是足够了,但是却不能获得有关高斯性的偏离度和非线性存在的信息。对比之下,用高阶累积量定义的高阶谱却含有这样的信息;

累积量问题的解具有唯一性。因为特征函数唯一地确定概率密度;

两个统计独立的随机过程的累积量等于各个随机过程累积量之和,该结论对于高阶矩却不成立。正是这一性质使得累积量非常适合于作为一种算子来使用。

4 高阶统计量方法的局限性及有待完善的方面

二维自相关匹配(或AR参数唯一可辨识)并不总是可能的,这是多维信号处理理论中一个尚未解决的难题。这一难题给累积量理论在多维非高斯信号处理中的应用带来了严重影响。

(1)由于二维高阶累积量具有比二维自相关函数多得多的独立变元,所以要解决方程的唯一最小二乘解的问题将更加困难。在自相关方法中通常要求使用尽可能宽的自相关滞后区域,以提高AR参数估计的精度。在累积量方法中,类似的做法将使得用到的方程个数增加很多,从而计算量大大增加。

(2)二维模型AR定阶的奇异值分解法至今尚未解决,因此总体最小二乘方法将无法应用。2

(3)在能够满足参数唯一可辨识性的二维AR模型尚未找到之前,这将使得二维最大高阶嫡也无法找到闭式解。

(4)虽然利用高阶累积量可以直接计算二维MA参数,但是由于这一直接计算要用到二维AR参数,所以二维AR参数也缺乏唯一可识别性。

(5)二维传递函数和二维多谱的参数化方法不能给出唯一的估计结果,因为二维AR和MA参数缺乏唯一可辨识性。

(6)由于二维因果模型的唯一可辨识性尚未解决,所以二维非因果模型的唯一可辨识性更难解决。

(7)多维谐波恢复的累积量方法有待解决和研究。二维谐波恢复的时域分析方法和直接数据法成功地解决了不对二维多项式因式分解(通常是不能因式分解的)进行谐波信号恢复的难题。如何将它们推广成相应的累积量方法显然是有趣的。也许更令人感兴趣的是,再进一步将非高斯噪声中谐波恢复的三种方法推广成适用于二维非高斯有色噪声。因为二维谐波恢复是多信号处理中的一个典型问题。

(8)基于累积量的多维非高斯信号的自适应滤波基本上还是个尚未研究的空白。

篇五:教育研究方法形成性考核册及参考答案 (123)

填空题(每空1分,共20分)教育研究方法试题

1.教育(科学)研究的本质特征是_创新___。教育科学研究的目的在于____ 探索教育规律_____,解决重要的教育理论和实际问题。

2.亚里士多德在__形式逻辑_______之上建立了科学方法论,并以巴巴拉式___ 三段论______为科学解释中演绎推理的范例,强调通过演绎建立科学解释,对以后的教育研究产生了深刻影响。

3.教育辞书和百科全书都属于____资料_____性工具书。我国第一部教育百科全书是1985年出版的《___中国大百科全书·教育______》。

4.理论构思所含的基本概念,特别是_核心概念 ________,应满足以下要求:一有严格规定的含义,二有好的_____ 概括度____,三有好的清晰度。

5.从观察的系统性来看,观察法可分___日常观察______和__科学观察_______。

6.教育观察资料的整理和分析主要包括___审核资料 ______、____资料归集_____、初步整理资料和进行描述统计等步骤。

7.根据访谈过程是否有严格设计的访谈提纲,可把访谈调查分为___.结构性 ______访谈调查和__非结构性_______访谈调查。

8. ___自变量 ______,即变化的措施、条件。无关变量,也叫__控制变量_______。

9.归纳法的具体方式有_简单枚举法__、完全归纳法和-- 科学归纳法--三种,前者又称不完全归纳法,后者又称因果关系归纳法。

10.根据一个判断与客观事物之间的直接关系程度和是否加入评价性要素,可以把命题分为__.事实命题(陈述性命题) ______和____价值(性)命题(评价性命题)_____两大类。

二、单项选择题(在每小题的四个备选答案中,选出一个正确答案,并将正确答案的序号填在题干的括号内。每小题2分,共20分)

1.在教育科学研究的基本要素及其活动过程中,形成( B )是教育研究的核心问题。

A.科学结论 B.科学理论

C.科学思想 D.科学观念

2.回答"将会怎么样"的问题,主要目的在于分析事物未来发展的前景与趋势的研究是( D )

A.基础研究 B.描述研究

C.发展性研究 D.预测研究

3.历史研究法的运用,特别强调研究者应具有(D)

A.历史感与正义感 B.历史感与责任感

C.责任感与现实感 D.历史感与现实感

4.我国著名的幼儿教育家陈鹤琴以自己的孩子为观察对象研究儿童的一般发展,主要采用的观察记录方法是(B)

A.描述记录法 B.日记描述法

C.轶事记录法 D.连续记录法

5.用百分制的办法对学生进行学科学习成绩测评属于(C)

A.定名测量 B.定序测量

C.定距测量 D.比率测量

6.教育调查研究中最基本的研究方法(手段),也是使用最广泛的一种基本方法(手段)是( D )

A.访谈调查 B.测量调查

C.表格调查 D.问卷调查

7.下列陈述错误的是“”( A )

A.教育实验是一种自然科学实验活动

B.教育实验首先是一种科学实验活动

C.教育实验是一种特殊的教育活动

D.教育实验是一种特殊的实验活动

8.反映实验自变量与因变量的因果关系的真实性,决定实验结果解释的是( A )

A.内在效度 B.外在效度

C.总体效度 D.生态效度

9.欲表示离散型的数据资料,首选的统计图类型是( A )

A.条形图B.圆形图

C.线型图D.直方图

10.一般来说,教育科研活动的最后一环是( D )

A.教育科研成果的表述B.教育科研成果的评奖

C.教育科研成果的交流D.教育科研成果的评价

三、名词解释(每小题4分,共16分)

1.理论构思 : 指以一定科学理论为指导,在已有的客观现实材料及理论研究成果基础上运用科学的思维方式对所要研究问题的现象、过程、本质或原因的一种理论解释。

2.历史研究法:借助于对有关社会历史过程的史料进行分析、破译和整理,以认识研究对象的过去、现在和预测未来的一种研究方法。

3.访谈调查:调查 (研究) 者通过与被调查者面对面的交谈,以口头问答的形式来了解某人、某事、某种行为和某种态度的一种调查 (研究) 方法。

4.协方差分析: 协方差分析是一种统计控制的方法,其功能是利用直线回归法,将足以影响实验结果却无法用实验方法加以控制的有关因素 (共变量) 从方差中剔除,再经调整后,求出方差的无偏估计量。

四、简答题(每小题5分,共20分)

1.简述选择样本的基本要求。

(1)明确规定总体。

(2)取样随机,使总体中所有成员都有同等的被选样机会。

(3)取样强调代表性,尽可能使抽取的样本代表总体。

(4)抽取样本容量合理,符合统计(学)要求,又切实可行,误差小。

2.简述确定研究课题的基本要求。

(1)问题必须有价值;

(2)问题有一定的科学依据和事实依据;

(3)问题必须具体明确;

(4)问题要新颖有独创性;

(5)问题(研究)要有可行性。

3.简述不同类型实验的共同特点。

(1)有明确的研究假设;

(2)对自变量进行操作,即要有实验处理;

(3)合理地控制无关变量;

(4)要建立实验的特质目标(测评目标体系)并实施测评。

4.编制教育科研成果评价指标体系应注意哪些要求?

(1)一致性,即评价指标体系须与总体目标一致。

(2)独立性。指所确定的评价指标应具相对独立性,外延不交叉。

(3)可测性。指标应当具体,用可操作化语言表达,并可以进行测量

核方法与累积量随机学习方法研究

或观察。

(4)可行性,即可用、有效性高。

五、论述题(每小题12分,共24分)

1.论述现代教育科学研究方法发展的主要特点。

(1)研究理论化程度提高(强调理性作用),主要表现为强调理论的指导作用;理论的构造性、清晰性和概括性提高;理论地研究教育,关注构建完善系统的理论体系,用哲学认识论从多方面分析教育问题。

(2)教育研究方法多元化、多样性与统一性,主要表现为系统方法、数学方法等综合运用。

(3)关注教育研究的社会性和价值标准,主要表现为研究目的以价值导向为根本依据,强调应用价值;研究实施强调大教育观,采取系统结构的观点;研究方法强调人的主体性,重视非理性因素的作用;组织形式强调科研群体,使个体优势互补,结果评价具有明显价值取向性。

(4)教育研究具有可操作性,在提高理论化程度的同时,加强了教育实验研究,主要表现为强调教育实验并提高其科学水平;数学方法、计算机技术的发展促进研究定量化;(现代)教育信息技术的应用。

2.如何根据实验研究报告,判断一个教育实验的设计、程序是否规范(尽可能举例说明)?

(1)标题是否较好地反映了该研究?是否内含有该实验的自变量和因变量?

(2)对研究目的的陈述是否清晰(性质、意义、交代、阐述是否清楚)?

(3)文献检索是否很好地提供了该实验研究的背景?

(4)理论假设用语是否明确?命题的论证根据是否充分?

(5)取样是否科学(样本的代表性、容量如何)?

(6)自变量、因变量及操作定义的确定是否合理?

(7)该实验属于何种类型?对无关因素控制采用什么方法?控制程度是否合理?

(8)实验所得数据的测量手段、操作过程及数据的整理分析是否有效、可靠和客观?收集的资料是否具有较好的信度、效度和系统性?

(9)研究所讨论的问题和结论是什么?在分析误差基础上进行的归因是否客观和符合逻辑?

(10)实验报告的写作是否客观(真实)?

教育科学研究方法试题(二)

一、填空题(每空1.5分,合计30分)

1、等距变量指能反映事物的类别和相对地位,但不能说明两者之间---倍数-----关系的变量。等距变量有-----

相等--单位,能用数量准确说明某量比另一量大(或小)多少,但无--- 绝对零点-----,等距变量之间能做-加减 ----运算,但不能进行--乘除------运算。

2、等距变量(比率变量)既有量的--相等单位-----,又有--- 绝对零点----,能够进行--加减乘除 ---运算。

3、相关设计又称--事后回溯设计------。

4、内在效度是指实验数据偏离真值的程度或--系统误差-----的大小。

5、-实证效度-----是指测验分数与效度标准之间的相关系数。

6、--同质性-- -是指测验内部所有项目分数之间的一致性。

7、--构想效度----是指测验能够检验理论的概念或特质的程度。

8、通常内容不是太多,或者访谈对象比较忙,没有更多的时间接受多次访问,可以采用--一次性访谈、----,内容话题很多,或者要深入探究某个问题,由于一次时间有限,所以就需要采用--多次性访谈------。