编者按:
近期小编打算推出一个最基础的社会统计学原理学习笔记系列,一方面是用大白话的形式,与更多跟小编一样没有任何数学或统计基础的同学一起学习社会统计学的机会;另一方面,温故而知新,通过反复复习去年在暑期班里所学的社会统计学原理这门课,使自己加深印象和理解,在整理笔记的过程中,可以巩固之前学过而遗忘的知识,也可以温故而知新。
社会统计学原理是社会科学定量研究的基础中的基础,也是必修课之一。在这之前,作者是完全没有数理基础和统计基础的小白一枚,纯文科,零基础。在这里与大家分享自己的学习笔记,过程中,难免有学习不到位之处,难免有错误之处,也欢迎大家多多交流,多多指正。
1描述性统计:通过数学方法对大量样本信息汇总、描述,如样本代表性、集中趋势等;2推断性统计:由样本的描述向总体的推断。2样本统计量:指的是样本的函数,并且此函数不含有未知参数。如:样本均值,样本方差等;4总体参数:描述总体特性的指标称为总体参数。如总体均值、总体方差等。1数据的测量尺度根据不同的测量标准会得到4类型的统计数据,同时可以反映出3个不同的维度。
数据的测量尺度可以归纳为三个属性(property),即:
1、顺序(Order):是否一个大的数字就表示比一个小的数字代表了更大价值?
2、差异(Difference):两个数字相减,是否代表一定意义?
3、比率(Ratio):两个数字之间的不同是否可以移植?
四类型数据分别是:
1、定类数据(Norminal):根据类别来测量得出的数据,不区分大小和顺序;
2、定序数据(Ordinal):也表现为类别不同,但可以比较大小顺序,但1和2之间的差异并不能解释3和4之间的差异;
3、定距数据(Interval):不仅能区别顺序,也能区别两者之间差异是相等的关系。(0值无意义):如收入20-40之间差与收入-之间的差都是差20元,这20元的意义是相等的。可以进行加减运算。
4、定比数据(Ratio):与定距数据的区别是(0值是有意义的),可以进行加减、乘除运算。
属性(property)
定类数据
(Norminal)
定序数据
(Ordinal)
定距数据
(Interval)
定比数据
(Ratio)
顺序(Order)
×
√
√
√
差异(Difference)
×
×
√
√
比率(Ratio)
×
×
×
√2变量类型除了定类、定序、定距、定比这样的分类(决定了使用哪种统计模型),还有另外两种分类尺度。
第一种:连续的VS离散的
1、离散变量(Discretevariable):其取值数值只能用自然数或整数单位计算,ex:家庭成员个数等。
2、连续变量(Continuousvariable):在一定区间内可以任意取值的,其数值是连续不断的,相邻两个数值可作无限分割,ex:人的身高、体重,汽车行驶速度等。
第二种:定量的VS定性的
1、定量变量(QuantitativeVariable):可以计算的数值型,包括连续的和离散的
2、定性变量(QualitativeVariable):只有分类变量才能作为定性数据
常见变量举例:
变量(Variable)
连续的(C)
VS离散的(D)
定性的(QL)
VS定量的(QT)
定类(N)、定序(O)
定距(I)、定比(R)
性别(男/女)
D
定性
N
季节(春、夏、秋、冬)
D
定性
N
采访者人数
D
定量
R
错误数
D
定量
R
一年中的吸烟时间
C
定量
R
最喜欢电影的排名
D
定量
O
满意度(1-5)
D
定量
I
体型分类(偏瘦、平均、偏胖)
D
定性
R
考试分数(1-)
C
定量
R
班级人数
D
定量
R
气温
C
定量
I
记忆时间
C
定量
R
食物的体积
C
定量
R
排名
D
定量
O
政治面貌
D
定性
N
残疾类型
D
定性
N
等级(A、B、C、D)
D
定性
O
婴儿体重
C
定量
R
大学SAT成绩
D
定量
I
每分钟心跳
D
定量
R
欢迎大家踊跃投稿,内容有关人文社会科学的即可,可以是学术前沿思想介绍、各种定量研究技术和方法介绍、各种软件(stata、Python、R语言,数据可视化等等)数据处理及分析技巧,可以是网络爬虫技巧,也可以是学术论文写作与发表等相关内容。
投稿邮箱:qunxue
qunxue.net.cn投稿要求:
1、务必原创、禁止抄袭;
2、务必准确、详细,有例子,有数据,有截图;
注意事项:
1、所有投稿都会经过本哪家医院白癜风能治愈北京治疗白癜风大约要花多少钱
转载请注明:http://www.baoshijiec.com/ylls/2624.html