2020计算机信息检索
一、单项选择题
第一个互联网信息检索工具是
- A. Google
- B. Archie
- C. Yahoo
- D. robot
- 答案:B. Archie
- 解释:Archie 是第一个互联网信息检索工具,用于 FTP 站点的文件索引。
URL 不适用于下列哪个通信协议?
- A. HTTP
- B. TCP/IP
- C. FTP
- D. Telnet
- 答案:B. TCP/IP
- 解释:URL 用于指定资源的位置,适用于 HTTP、FTP 和 Telnet 等应用层协议,但 TCP/IP 是网络通信协议,不是应用层协议。
第一个在搜索结果中使用了网页自动摘要的通用搜索引擎是
- A. Lycos
- B. Ask.com
- C. Excite
- D. Yahoo
- 答案:A. Lycos
- 解释:Lycos 是第一个在搜索结果中使用网页自动摘要的通用搜索引擎。
互联网上最早的免费电子图书生产者是
- A. 古腾堡计划
- B. 书同文古籍书库
- C. Ebrary
- D. Safari
- 答案:A. 古腾堡计划
- 解释:古腾堡计划是互联网上最早的免费电子图书生产者。
下列选项中属于基于文本的音频搜索引擎的是
- A. www.hulu.com
- B. www.midomi.com
- C. www.themefinder.org
- D. www.allmusic.com
- 答案:B. www.midomi.com
- 解释:Midomi 是一个基于文本的音频搜索引擎。
开放获取期刊中,全球最大的免费全文学术文献网站是
- A. JSTOR
- B. DOAJ
- C. HighWire
- D. CNKI
- 答案:B. DOAJ
- 解释:DOAJ(Directory of Open Access Journals)是全球最大的免费全文学术文献网站。
号称“世界上最好用的图像搜索工具”的是
- A. www.flickr.com
- B. images.Google.com
- C. www.picsearch.com
- D. image.Baidu.com
- 答案:B. images.Google.com
- 解释:Google 图片搜索是广泛认为最好用的图像搜索工具。
信息检索时,检出的相关信息资源量与检出的信息资源总量之比是
- A. 检索限定
- B. 检索范围
- C. 检索技术
- D. 检准率
- 答案:D. 检准率
- 解释:检准率是指检出的相关信息资源量与检出的信息资源总量之比。
信息检索中,希望限制查询特定计算机主机的网页,需要使用的通用字段是
- A. applet
- B. like
- C. link
- D. host
- 答案:D. host
- 解释:使用
host
字段可以限制查询特定计算机主机的网页。
使用操作符时,强制指定运算的先后顺序的布尔逻辑操作符是
- A. 引号操作符
- B. 括号操作符
- C. 通配符
- D. Near 操作符
- 答案:B. 括号操作符
- 解释:括号操作符用于强制指定运算的先后顺序。
搜索获取新闻最直接、最快捷的方式是
- A. 垂直搜索引擎
- B. 手机 APP
- C. 新闻搜索引擎
- D. 门户网站
- 答案:C. 新闻搜索引擎
- 解释:新闻搜索引擎专门用于搜索新闻,是最直接和快捷的方式。
在因特网上查找某类产品的使用销售情况时,最好使用的检索参考源是
- A. 白页信息
- B. 维基解密
- C. 人物传记资料
- D. 网络资源目录
- 答案:A. 白页信息
- 解释:白页信息通常包含产品和服务的详细信息,适合查找产品的使用和销售情况。
下列选项中不属于元搜索引擎检索特点的是
- A. 一次提交多个数据库
- B. 没有自己独立的资源库
- C. 服务多样化
- D. 检索结果可靠
- 答案:C. 服务多样化
- 解释:元搜索引擎的特点包括一次提交多个数据库、没有独立的资源库和检索结果可靠,但服务多样化不是其特点。
可对行车/步行路线提供实时查询的最佳参考信息检索工具是
- A. 百科全书
- B. 旅游网站
- C. 网上地图
- D. 黄页
- 答案:C. 网上地图
- 解释:网上地图(如 Google 地图)可以提供行车和步行路线的实时查询。
为快速响应检索,在组织信息时必须建立的是
- A. 归类
- B. 聚类
- C. 索引
- D. 匹配
- 答案:C. 索引
- 解释:索引可以加快信息检索的速度,是快速响应检索的关键。
二、名词解释题
浏览器(Browser)
解释:浏览器是一种用于访问和浏览互联网上网页的软件应用程序。常见的浏览器包括 Google Chrome、Mozilla Firefox 和 Microsoft Edge。
传记资料
解释:传记资料是指关于某个人物生平、成就和影响的详细记录,通常包括出生、教育、职业、家庭等信息。
元数据
解释:元数据是关于数据的数据,用于描述数据的特征和属性,帮助用户更好地理解和使用数据。
参考信息
解释:参考信息是指用于支持或验证某个观点、事实或数据的额外信息,通常来自可靠的来源。
三、判断改错题
互联网上的信息资源中,商务信息是网上最有价值的信息。
答案:√
解释:商务信息通常具有较高的价值,因为它涉及商业决策、市场分析等重要内容。
超链接实际上就是链接,类似于传统文献检索中的“追溯检索”,但检索效率已大大提升。
答案:√
解释:超链接确实类似于传统文献检索中的追溯检索,但通过互联网,检索效率得到了显著提升。
布尔检索模型是最简单的检索模型,也是其他检索模型的基础。
答案:√
解释:布尔检索模型是最基本的检索模型,其他复杂的检索模型通常在此基础上扩展。
维基解密是一个语言、内容开放的网络百科全书计划。
答案:×
解释:维基解密是一个发布机密信息的平台,而不是网络百科全书计划。正确的描述应该是“维基百科是一个语言、内容开放的网络百科全书计划”。
联机图书馆公共可检索目录,即 OPAC,是一个基于网络的开放式书目检索系统。
答案:√
解释:OPAC(Online Public Access Catalog)是一个基于网络的开放式书目检索系统,允许用户在线检索图书馆的藏书。
四、简答题
简述互联网信息资源的一般性评价单位以及评价方法。
答案:
评价单位:互联网信息资源的评价单位通常包括网站、网页、数据库、多媒体资源等。
评价方法:评价方法包括内容准确性、权威性、时效性、相关性和可用性等方面。可以通过查看来源、作者资质、更新日期、引用次数等指标进行评价。
简述搜索引擎的一般工作流程以及流程的四个主要步骤。
答案:
工作流程:搜索引擎通过爬虫程序抓取网页,建立索引数据库,处理用户查询,并返回相关结果。
四个主要步骤:
- 网页抓取:使用爬虫程序抓取互联网上的网页。
- 索引建立:对抓取的网页内容进行分析和索引。
- 查询处理:处理用户的搜索请求,分析关键词。
- 结果返回:根据相关性排序并返回搜索结果。
简述目录型网络检索工具的使用方法。
答案:
使用方法:
- 确定主题:明确要检索的主题或领域。
- 选择目录:在目录型检索工具中找到相关的分类目录。
- 浏览条目:浏览目录下的条目,找到相关的资源链接。
- 访问资源:点击链接访问具体的网页或资源。
简述关键词选取时常用的 5 个步骤;并解释关键词“神舟飞船 OR (载人航天 AND 中国)”的含义。
答案:
关键词选取步骤:
- 确定主题:明确检索的主题。
- 列出关键词:列出与主题相关的关键词。
- 扩展关键词:考虑同义词、近义词和相关术语。
- 组合关键词:使用布尔逻辑(AND、OR、NOT)组合关键词。
- 测试和调整:测试关键词组合的效果,并根据需要调整。
关键词含义:
- “神舟飞船 OR (载人航天 AND 中国)”表示检索结果中包含“神舟飞船”或者同时包含“载人航天”和“中国”。
五、论述题
试述搜索引擎发展过程中 3 个阶段的主要特点和代表引擎。
答案:
第一阶段(1990年代初-中期):
- 特点:以目录分类为主,人工编辑目录。
- 代表引擎:Yahoo。
第二阶段(1990年代中期-晚期):
- 特点:引入爬虫技术,自动索引网页。
- 代表引擎:Lycos、Altavista。
第三阶段(1990年代晚期-至今):
- 特点:使用复杂算法(如 PageRank)提高检索质量,提供多种检索服务。
- 代表引擎:Google、Bing。
试述目前搜索引擎的“瓶颈”与不足,以及网络信息检索中可能存在的法律风险。
答案:
瓶颈与不足:
- 信息过载:搜索结果过多,用户难以快速找到所需信息。
- 检索精度:难以完全理解用户意图,导致相关性不高的结果。
- 实时性:部分搜索引擎对新信息的更新不够及时。
- 隐私问题:用户搜索行为可能被跟踪和利用。
法律风险:
- 版权侵权:未经授权使用受版权保护的内容。
- 隐私侵犯:泄露用户个人信息。
- 虚假信息:传播不实信息可能导致法律责任。
- 跨境法律冲突:不同国家的法律对信息检索有不同的规定,可能导致法律纠纷。