网上药店
您现在的位置: 科学管理原理 >> 科学管理原理历史 >> 正文 >> 正文

数据挖掘道试题,测测你的专业能力过

来源:科学管理原理 时间:2018-7-2

来源:36大数据

网址:      (对)

7.离散属性总是具有有限个值。            (错)

8.噪声和伪像是数据错误这一相同表述的两种叫法。       (错)

9.用于分类的离散化方法之间的根本区别在于是否使用类信息。    (对)

10.特征提取技术并不依赖于特定的领域。         (错)

11.序列数据没有时间戳。         (对)

12.定量属性可以是整数值或者是连续值。       (对)

13.可视化技术对于分析的数据类型通常不是专用性的。      (错)

14.DSS主要是基于数据仓库.联机数据分析和数据挖掘技术的应用。(对)

15.OLAP技术侧重于把数据库中的数据进行分析、转换成辅助决策信息,是继数据库技术发展之后迅猛发展起来的一种新技术。(对)

16.商业智能系统与一般交易系统之间在系统设计上的主要区别在于:后者把结构强加于商务之上,一旦系统设计完毕,其程序和规则不会轻易改变;而前者则是一个学习型系统,能自动适应商务不断变化的要求。(对)

17.数据仓库中间层OLAP服务器只能采用关系型OLAP(错)

18.数据仓库系统的组成部分包括数据仓库,仓库管理,数据抽取,分析工具等四个部分.(错)

19.Web数据挖掘是通过数据库仲的一些属性来预测另一个属性,它在验证用户提出的假设过程中提取信息.(错)

21.关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则。(错)

22.利用先验原理可以帮助减少频繁项集产生时需要探查的候选项个数(对)。

23.先验原理可以表述为:如果一个项集是频繁的,那包含它的所有项集也是频繁的。(错)

24.如果规则不满足置信度阈值,则形如的规则一定也不满足置信度阈值,其中是X的子集。(对)

25.具有较高的支持度的项集具有较高的置信度。(错)

26.聚类(clustering)是这样的过程:它找出描述并区分数据类或概念的模型(或函数),以便能够使用模型预测类标记未知的对象类。(错)

27.分类和回归都可用于预测,分类的输出是离散的类别值,而回归的输出是连续数值。(对)

28.对于SVM分类算法,待分样本集中的大部分样本不是支持向量,移去或者减少这些样本对分类结果没有影响。(对)

29.Bayes法是一种在已知后验概率与类条件概率的情况下的模式分类方法,待分样本的分类结果取决于各类域中样本的全体。(错)

30.分类模型的误差大致分为两种:训练误差(trainingerror)和泛化误差(generalizationerror).(对)

31.在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题。(错)

32.SVM是这样一个分类器,他寻找具有最小边缘的超平面,因此它也经常被称为最小边缘分类器(minimalmarginclassifier)(错)

33.在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。(错)

34.聚类分析可以看作是一种非监督的分类。(对)

35.K均值是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。(错)

36.给定由两次运行K均值产生的两个不同的簇集,误差的平方和最大的那个应该被视为较优。(错)

37.基于邻近度的离群点检测方法不能处理具有不同密度区域的数据集。(对)

38.如果一个对象不强属于任何簇,那么该对象是基于聚类的离群点。(对)

39.从点作为个体簇开始,每一步合并两个最接近的簇,这是一种分裂的层次聚类方法。(错)

40.DBSCAN是相对抗噪声的,并且能够处理任意形状和大小的簇。(对)

近期精彩活动(直接点击查看):

福利·阅读

免费申请读大数据新书第12期

END

版权声明:

转载文章均来自公开网络,仅供学习使用,不会用于任何商业用途,如果出处有误或侵犯到原作者权益,请与我们联系删除或授权事宜,联系邮箱:holly

.







































北京哪里医院看白癜风好
2018治疗白癜风最好的药哪里有卖

转载请注明:http://www.baoshijiec.com/ylls/2129.html