数据可视化客观题题库

第四章:单选题
ss4-1 比例呈现最简单的方式就是计算出部分与整体的关系。而呈现这种整体与部分关系最简单的方式就是使用我们最熟悉的(    )了。A
A、 柱状图 B、 饼图 C、 折线图 D、 散点图
ss4-2 我们通常使用matplotlib.pyplot.(        )函数来绘制饼图。
A、 scatter B、 figure C、 bar D、 pie
ss4-3我们通常使用matplotlib.pyplot.( )函数来绘制堆叠柱状图。
A、 pie B、 bar C、 plot D、 scatter
ss4-4 我们通常使用matplotlib.pyplot.( )函数来绘制堆叠面积图。
A、 scatter B、 bar C、 stackplot D、 pie
第四章:多选题
ds4-3 我们在使用matplotlib.pyplot.stackplot函数来绘制堆叠面积图时baseline基线参数有( )种取值。
A、 sym B、 wiggle C、 weighted_wiggle D、 zero
第四章:判断题
tf4-1 当构成整体的数据项较多时,采用饼图是一种不错的选择。
第四章:填空题
fb4-1 我们通常把按照类别、子类别、群体进行的划分的数据称为( )型数据。A
fb4-2 matplotlib使用pie函数绘制饼图时( )参数用来设置饼图中每一块楔形离开中心的距离。
fb4-3 使用matplotlib的pie函数绘制饼图时( )参数用来为饼图设置阴影。
fb4-4 使用matplotlib的pie函数绘制饼图时( )参数用来标注每块饼图的matplotlib颜色参数序列。
fb4-5 使用matplotlib的pie函数绘制饼图时( )参数用来控制饼图内百分比设置,可以使用format字符或者format function设定百分比标签的格式。
fb4-6 使用matplotlib的pie函数绘制饼图时( )参数用来为饼图设置起始绘制角度。
fb4-7 使用matplotlib的pie函数绘制饼图时( )参数用来为饼图指定指针方向。默认为True,即( )时针。将值改为( )即可改为顺时针。
第五章:单选题
ss5-1 数据的关联性,其核心就是指量化的两个数据间的数理关系。( )是指当一个数值变化时,另一个数值也会随之相应地发生变化。A
A、 关联性弱 B、 关联性强 C、 不相关 D、以上都不对
ss5-2在下图所示的散点图中我们可以看出横轴与纵轴所表示的两个量之间是( )关系。
A、 正相关
B、 负相关
C、 不相关
D、 以上都不对

ss5-5我们可以使用matplotlib.pyplot模块中的( )函数绘制直方图。
A、 pairPlot
B、 hist
C、 histogram
D、 scatter
ss5-6我们可以使用matplotlib.pyplot模块中的( )函数绘制气泡图。
A、 hist B、 pairPlot C、 scatter D、 plot
ss5-7我们在使用使用matplotlib.pyplot.hist函数绘制直方图时( )参数用于指定直方图数据的上下界。
A、 bins B、 range C、 bottom D、 align
ss5-8我们在使用使用matplotlib.pyplot.hist函数绘制直方图时( )参数用于设置直方图的水平对齐方式。
A、 align B、 orientation C、 bins D、 bottom
ss5-9我们在使用使用matplotlib.pyplot.hist函数绘制直方图时( )参数用于设置直方图的方向。
A、 bins B、 histtype C、 align D、 orientation
ss5-10我们在使用使用matplotlib.pyplot.hist函数绘制直方图时( )参数用于设置所绘制的直方图的类型。
A、 orientation B、 bins C、 histtype D、 type
ss5-11我们在使用使用matplotlib.pyplot.hist函数绘制直方图时( )参数用于为直方图的每个条形添加基准线。
A、 align B、 orientation C、 bottom D、 label
第五章:判断题
tf5-1 通过数据关联性,就可以根据一个已知的数值变化来预测另一个数值的变化。
tf5-2 我们可以通过散点图和气泡图来表示数据之间的关联关系。
第五章:填空题
fb5-1 在关系型数据中,( )相关的两个变量变动趋势相同,一个变量由大到小或由小到大变化时,另一个变量亦随之由大到小或由小到大变化。
fb5-2在关系型数据中,( )相关的两个变量的变化方向相反,也可理解成事态发展的对立关系。
fb5-3 数据的( )性,其核心就是指量化的两个数据之间的数理关系。
fb5-4 数据的关联性,其核心就是指量化的两个数据之间的数理关系。关联性( ),是指当一个数值变化时,另一个数值也随之相应地发生变化。相反地,关联性( ),就是指一个数值变化时,另一个数值几乎没有发生变化。
fb5-5 通过数据( )性,就可以根据一个已知的数值变化来预测另一个数值的变化。
fb5-6 关系数据具有( )性和( )性
第六章:填空题
fb6-1 ( )数据可视化的目的在于利用可视化表达技术刻画文本和文档,将其中的信息直观地呈现给用户。用户通过感知和辨析这些可视化的图元信息,从中获取所需的信息。
fb6-2 文本数据可视化的重要原则是帮助用户快速、准确地从文本中( )信息并将其展示出来。
fb6-3 文本数据可视化可以分为文本( )的可视化、文本( )的可视化以及文本多特征信息的可视化。
fb6-4 (  )是由多伦多大学的Christopher Collins教授制作的一个在线文本分析可视化工具,通过导入( )的文本数据,生成( )的可视化图片。
fb6-5 文献指纹(Literature Fingerprinting)是体现全文特征分布的一项工作。一个像素块代表一段(    ),一组像素块代表一本(    )。
fb6-6 文本关系包括文本(   )或者文本(    )的关系,以及文本集合之间的关系,比如文本的相似性、互相引用的情况、链接等。文本关系可视化的目的就是呈现出这些关系。
第六章:单选题
ss6-1 不同级的信息挖掘方法也不同,( )是使用各类分词算法。A
A、 语法级 B、 词汇级 C、 语义级 D、 文字级
ss6-2 不同级的信息挖掘方法也不同,(   )使用语句分析算法。
A、 语法级 B、 文字级 C、 语义级 D、 词汇级
ss6-3 不同级的信息挖掘方法也不同,(  )是使用主题抽取算法。
A、 词汇级 B、 文字级 C、 语义级 D、 语法级
ss6-6 文本(         )可视化是对文本内的关键信息分析后的展示
A、 关系 B、 内容 C、 形式 D、 多特征信息
ss6-7文本(   )的可视化既可以对单个文本进行内部的关系展示,也可以对多个文本进行文本之间的关系展示;
A、 形式 B、 内容 C、 多特征信息 D、 关系
ss6-8文本(    )的可视化,是结合文本的多个特征进行全方位的可视化展示。
A、 内容 B、 多特征信息 C、 主题 D、 关系
ss6-9文档散(DocuBurst)是由多伦多大学的Christopher Collins教授制作的一个(   ),通过导入TXT格式的文本数据,生成HTML格式的可视化图片。
A、 图形分析可视化工具 B、 在线文本分析可视化工具
C、 离线文本分析可视化工具 D、 关键词可视化工具
ss6-10标签云(Tag Clould)是一种最常见的、简单的( )可视化方法
A、 时序文本 B、 关键词 C、 文本分布 D、 文本关系
ss6-11主题河流(ThemeRiver)是由Susan Havre等学者于2000年提出的一种时序数据可视化方法,主要用于反映文本主题强弱变化的过程。经典的主题河流模型包括( )和宽度两个属性
A、 颜色 B、 大小 C、 形状 D、 以上都不正确
ss6-12常用的将文本转化为向量的方法有VSM(向量空间模型)和(  )。
A、 主题抽取 B、 TF-IDF C、 LDA D、 LSI
ss6-13(        )是使用向量符号对文本进行度量的代数模型,把对文本内容的处理简化为向量空间中的向量运算,并且以空间相似度表达语义相似度。
A、 主题抽取 B、 向量空间模型 C、 文档主题生成模型 D、 隐含语义检索模型
ss6-14(         )指在信息检索中,将某一文本仅看作是一个词集合,而不考虑其语法、词序等信息。文本中每个词相互独立,不依赖于其他词的出现与否。
A、 TF-IDF
B、 词袋模型(Bag of Words)
C、 LDA( Latent Dirichlet Allocation,文档主题生成模型 )
D、 LSI(Latent Semantic Indexing,隐含语义检索模型)
ss6-15(     )是主题河流可视化技术的一种扩展,它不仅可以表达主题的变化,还能随着时间的推移展示各个主题之间分裂与合并的状态。
A、 故事流 B、 文本流(TextFlow)
C、 文本弧(TextArc) D、 文献指纹(Literature Fingerprinting)
ss6-16(          )常用来表示电影或者小说里的剧情线或者时间线。
A、 文本流(TextFlow) B、 主题河流
C、 故事流 D、 文本弧(TextArc)
ss6-17(   )可视化技术不仅可以展示词频,还可以展示词的分布情况。
A、 主题河流 B、 文本弧(TextArc)
C、 故事流 D、 文本流(TextFlow)
ss6-18(   )经常采用的是基于图的方式进行可视化,如词语树(word tree)、网络短语(phrase nets)、矩阵树图(NewsMap)等。
A、 文本内容关系可视化 B、 文档间关系可视化
C、 文本多特征信息可视化 D、 以上都不对
ss6-19(    )是指从多个角度或提取多种特征对文本集合分析。对文本数据进行可视化时,可结合文本的多个特征进行分析。
A、 文档内容可视化 B、 文档关系可视化 C、 多特征 D、 以上都不对
ss6-20(    )使用树形图展示词语在文本中的出现情况,可以直观地呈现出一个词语和其前后的词语。
A、 文献指纹(Literature Fingerprinting) B、 词语树(Word Tree)
C、 文本弧(TextArc) D、 文本流(TextFlow)
第六章:多选题
ds6-1 鉴于人们对文本信息需求的多样性,我需要从不同层级提取并呈现文本信息。一般把对文本的理解需求分成(   )、(   )和(   )三级。
A、 词汇级 B、 文字级 C、 语法级 D、 语义级
ds6-2 文本信息的类别多种多样,一般包括( )、( )和(  )三大类。
A、 单文本 B、 文档集合 C、 图片集合 D、 时序文本数据
ds6-3 大数据中文本可视化的基本流程主要包括(  )、(  )和(  )。
A、 文本信息挖掘 B、 文本数据清洗 C、 视图绘制 D、 人机交互
ds6-4 文本数据可视化可以分为文本( )的可视化、文本( )的可视化以及文本( )的可视化。
A、 多特征信息 B、 内容 C、 结构 D、 关系
ds6-5 对于文本内容的可视化,主要体现在以下( )几个方面。
A、 关键词可视化 B、 词汇可视化 C、 时序文本可视化 D、 文本分布可视化
ds6-6 时序文本可视化常用技术有( )、( )和(  )。
A、 主题河流(ThemeRiver) B、 文本流(TextFlow)
C、 故事流(StoryFlow) D、 关系流(RelationShipFlow)
ds6-7 体现文本分布的可视化方法有:
A、 故事流 B、 文本弧(TextArc)
C、 主题河流 D、 文献指纹(Literature Fingerprinting)
ds6-8 文本弧(TextArc)可视化技术不仅可以展示词频,还可以展示词的分布情况。文本弧的特性有(     )A
A、 用一条螺旋线表示一篇文章,螺旋线的首尾对应着文章的首尾,文章的词语有序地布局在螺旋线上。
B、 若词语在整片文章中出现都比较频繁,则靠近画布的中心分布。
C、 若词语只是局部出现得比较频繁,则靠近螺旋线分布。
D、 字体的大小和颜色深度代表着词语的出现频率
ds6-9 文档间关系可视化的方法有(       )等.A
A、 星系视图 B、 词语树(word tree)
C、 主题地貌(Theme map) D、 文档集抽样投影
第六章:判断题
tf6-1 文本信息的类别多种多样,一般包括纯文本、文档集合和时序文本数据三大类。
解析:文本信息的类别多种多样,一般包括单文本、文档集合和时序文本数据三大类。
tf6-2 鉴于人们对文本信息需求的多样性,我需要从不同层级提取并呈现文本信息。一般把对文本的理解需求分成三级:词汇级(Lexical Level)、语法级(Syntactic Level)和语义级(Semantic Level)。
tf6-3 不同级的信息挖掘方法也不同,语法级是使用各类分词算法,而词汇级使用语句分析算法,语义级则是使用主题抽取算法。
tf6-4 大数据中文本可视化的基本流程主要包括文本信息挖掘、视图绘制以及人机交互
tf6-5 网络爬虫就是根据URL统一资源定位符对Web信息进行获取的。
tf6-9 文本属于非结构化数据,不能直接用于可视化,需要使用向量符号将文本度量成数学模型。
tf6-10 文本的内容可以通过关键词、短语、句子和主题进行展现。
tf6-11一个词语若在一个文本中出现的频率较高,那么,这个词语就可能是这个文本的关键词,它可以在一定程度上反映出一个文本内容所要表达的含义
tf6-12 TF-IDF(Term Frequency-Inverse Document Frequency)是一种用于信息检索与数据挖掘的常用加权技术。
tf6-13 IDF的含义是词频,是一个词语在一篇文件中出现的次数除以该文件的总词语数。
tf6-14 TF的含义是词频(Term Frequency),是一个词语在一篇文件中出现的次数除以该文件的总词语数。
tf6-15 TF-IDF用于评估某个单词或字在一个文档集或语料库的重要程度
tf6-16 星系视图(Galaxy View)可用于表征多个文档之间的相似性。
tf6-17  当一个文档集中包含的文档数量过小时,投影出来的星系视图中就会产生很多重叠的星星。为了避免这种重叠情况的出现,用户可以对文档集进行抽样,有选择性地抽取部分文档进行投影,这样可以更加清晰地显示每个样本。
tf6-18 多特征是指从多个角度或提取多种特征对文本集合分析。对文本数据进行可视化时,可结合文本的多个特征进行分析。
第七章:填空题
fb7-1 每个数据对象有两个或两个以上独立或者相关属性的数据。(   )指数据具有多个独立属性,(       )指数据具有多个相关属性。
fb7-2 多元数据可视化面临的一个主要挑战是在有限的屏幕空间中如何显示(       )数据
fb7-3(       )图的本质是将抽象的数据对象映射到二维坐标表示的空间。面向多元数据该图的概念可以理解成:在二维的平面空间中,通过采用不同的空间映射方法对高维数据进行布局,则这些数据的关联以及数据自身的属性就在空间中的位置得到了展示。
fb7-4 多元数据可视化的三类基本方法有(             )、图标法和基于像素的可视化方法。
fb7-5 多元数据可视化的三类基本方法有空间映射、(             )和基于像素的可视化方法。
fb7-6 多元数据可视化的三类基本方法有空间映射、图标法和基于( )的可视化方法。  
fb7-7 可视化领域以及计算机图形学有一种标准方法叫作(           ),如二叉树、四叉树等空间管理结构等。
第七章:单选题
ss7-1 以下数据可视化方法中(     )种方法不属于基于像素的数据可视化方法
A、 像素图 B、 像素柱状图 C、 箱线图 D、 马赛克图
ss7-2 以下(    )类数据可视化方法属于图标法的典型代表。
A、 雷达图 B、 像素图 C、 表格透镜 D、 散点图矩阵
ss7-3 以下( )类数据可视化方法属于空间映射法
A、 雷达图 B、 像素图 C、 散点图矩阵 D、 马赛克图
ss7-4 以下( )数据可视化方法属于多元数据可视化三类基本方法中图标法的典型代表。
A、 雷达图 B、 像素图 C、 散点图矩阵 D、 马赛克图
209、ss7-5 多元数据可视化的三类基本方法有空间映射、( )和基于像素的可视化方法。
A、 平行坐标法 B、 图标法 C、 灵活轴线法 D、 表格透镜
ss7-6 多元数据可视化的三类基本方法有空间映射、图标法和( )。
A、 平行坐标法 B、 表格透镜 C、 基于像素的可视化方法 D、 图表法
ss7-7 我们通过使用matplotlib.pyplot模块中的( )函数,可以绘制盒须图(又叫箱线图)。
A、 plot B、 boxplot C、 pairplot D、 box
第八章:填空题
fb8-1 从可视化系统设计的角度出发,通常需要根据系统将要完成的任务的类型选择交互技术。按照任务类型分类可以将数据可视化中的交互技术分为选择、(      )、重新编码、导航、关联、(     )、概览和细节等八种类型。
fb8-2 从可视化系统设计的角度出发,通常需要根据系统将要完成的任务的类型选择交互技
fb8-6 数据可视化交互技术中导航的基本操作有三种,分别是(         )、缩放和旋转
第八章:判断题
tf8-1 过滤技术就是使用可视化的方式展现数据之间联系的一种技术,特别是在多视图中,该技术应用广泛。
tf8-3 数据可视化交互技术中导航的基本操作有两种,分别是缩放和旋转
第八章:单选题
ss8-1(     )指的是从用户操作开始到结果返回经历的时间,延时的长短在很大程度上直接决定了用户体验的效果。
A、 交互场景 B、 交互延时 C、 交互成本 D、 交互类型
ss8-2 在数据可视化中交互的技术有很多种,其中(     )的意义在于标记出感兴趣的对象,以便进一步追踪处理.
A、 选择 B、 导航 C、 过滤 D、 关联
ss8-3 在数据可视化交互技术中(      )技术就是使用可视化的方式展现数据之间联系的一种技术,特别是在多视图中,该技术应用广泛。
A、 过滤 B、 概览 C、 关联 D、 导航
ss8-4 数据可视化交互技术有很多种,其中(   )可以为用户提供一个整体观察数据的角度,让用户可以从宏观上把握,对全局信息有整体的判断,这个过程是一个引导阶段,用户可以基于这样的判断更为深入的了解详细的数据。
A、 过滤 B、 概览 C、 细节 D、 关联
第八章:多选题
ds8-1 除了视觉呈现部分外,用户交互部分也是数据可视化中一个非常重要的要素。交互在可视化中的作用主要体现在(       )方面。A
A、 交互能让用户拥有更好的视听体验
B、 交互能让用户更好地理解和分析数据。
C、 交互能够清晰的呈现海量数据
D、 交互有效地缓解了可视化空间和数据过载之间的矛盾。
ds8-2 设计可视化系统或选择交互方式的时候,除了能够完成任务本身之外,还要遵循(         )三个基本的原则。
A、 交互延时 B、 概览和细节 C、 交互成本 D、 交互场景
第九章:单选题
ss9-1 (       )数据可视化的研究范围涉及数字图像处理、计算机图形学、计算机视觉以及医学等领域,是生物医学工程中的一个非常重要的多学科交叉研究领域,其研究成果已被广泛应用于临床诊断、手术模拟仿真、外科整形、假肢制造、解剖教学等医学领域
A、 天文研究 B、 医学影像 C、 石油勘探 D、 气象预报
第九章:多选题
ds9-1 目前,在医学可视化领域主要包含(      )三个方面的研究热点。
A、 图像分割技术 B、 图像叠加 C、 实时渲染技术 D、 图像标定技术