10月30号下午2点,科研训练营的第二讲——“定量研究设计与流程”正式开讲。此次与大家分享经验的是人口研究所的副所长,李强老师。开场时李老师以自己为例,述说了一个文科生学定量的故事,鼓励大家不必害怕数字、分析,打消了不少同学们对定量研究的顾虑。
李强老师的开场介绍
步入正题后,李老师首先说明了数据是定量研究的前提,展开一项定量研究,首先要进行研究设计,特别是在搜集数据前,大家先要思考几个问题,即“为什么搜集数据,研究的目的是什么?如何搜集搜集数据,研究方法是什么?我们的研究对象是什么?样本量是多少?变量又有几个?”。当明确了这些问题之后,等我们拿到数据,就可以用数据来检验我们的研究假设了。而研究通常要反映是什么(描述性研究)和为什么(解释性研究)两个问题。由于定量的数据来自于抽样调查,仅在一定程度上具有代表性。所以为了反映总体,我们必须在研究中解答样本结果在多大程度上可以反映总体,样本事实是否在总体上也是事实等问题。
那么如何进行一项定量研究呢?李老师紧接着为大家普及了定量研究的一般流程。首先,要获得能够反映客观事实的数据,同时老师建议大家做定量研究时,可以用大型调查的数据库(后附),样本更科学更能反映总体。其次拿到了珍贵的数据之后,我们要知道用数据“说话”,分析数据以服务于我们的研究问题,即使用科学的研究方法对数据进行正确处理和分析,让数据显现出规律。
分析数据可以获得结论,而获得结论的前提是多变量分析,即在控制某些相关因素的基础上,来分析X因素对Y因素的作用。为了帮助同学们更好地理解,老师以自变量(性别、教育程度)、因变量(对离婚的态度)为例,向大家生动地展示了自变量和因变量之间的关系。老师为了大家方便理解变量,解释道变量即可取不同值的量,同时还介绍了连续变量和离散变量区别,并举例让同学们辨识。
那么如何分析数据得到结论呢?李老师就此引出分析数据需要建立模型。老师首先以年龄和收入作为变量,为大家介绍了线性回归模型。但老师也强调了能否用这个线性回归模型来反映年龄和收入的关系,还要看这些数据是否符合模型的要求或模型的假定条件。比如Y要正态分布;不同的Y之间要相互独立;Y在不同的X下的方差要相等;X和Y要具有线性关系等等。
除了常用的一元回归线性模型之外,李老师还介绍了目前社会科学研究中的常用模型,最为常见的是T检验和方差分析、多元线性回归、Logistics回归、Ordered Logit回归。而像多层线性回归、生存分析、结构方程模型、潜在变量模型和倾向值分析等模型掌握起来还是比较麻烦的,但是如果能用这些模型分析数据,比较容易受到学界的认可和敬佩。老师还向同学们介绍了目前做定量模型接受度高的原因之一是做理论研究非常难,所以鼓励大家可以多多学习模型的使用。
结合平时教学过程中,同学们经常会难以分辨清楚因果关系和相关关系。因此,老师带我们从判断因果关系的四个条件出发分析二者的区别和联系。如果关系满足二者相关(相关性)、有时间先后顺序、非虚假相关(虚假相关:XY都受到第三个变量的影响)和理论可证明这四个条件,那么变量间的关系就不属于相关关系,而属于因果关系。
这场讲座或许对大家是一个启蒙,如果想深入研究定量,老师还给出了几篇可以参考的文献。听完李强老师的分享,同学们对定量研究的设计和流程有了初步的了解。针对此次讲座的疑问并结合自己平时研究中遇到的问题,几位同学们分别向老师提出了自己的疑问和困惑,李强老师以通俗易懂的回答一一解答了大家的问题。
由于时间关系,部分同学的问题没有在讲座中获得解答,因此在活动结束后,这部分好学的同学意犹未尽,讲座后向李老师请教问题。参加科研训练营的同学们大多表示收获很大,也祝愿今后各位都能用在自己的研究中学以致用,将定量研究运用到学习和科研中。