㈠ 信息检索的本质为什么是人工智能

好问题,马一下,稍候再来回答。

㈡ 人工智能有什么好的参考书么

Peter Norvig 的《AI, Modern Approach 2nd》(无争议的领域经典)
Bishop, 《Pattern Recognition and Machine Learning》. 没有影印的,但是网上能下到。经典中的经典。Pattern Classification 和这本书是两本必读之书。《Pattern Recognition and Machine Learning》是很新(07年),深入浅出,手不释卷。

推荐两本有意思的书,
一本是《Simple Heuristics that Makes Us Smart》
另一本是《Bounded Rationality: The Adaptive Toolbox》

---------------------------------------------------------------------
<从CSDN上转载的>

机器学习与人工智能学习资源导引

我经常在 TopLanguage 讨论组上推荐一些书籍,也经常问里面的牛人们搜罗一些有关的资料,人工智能、机器学习、自然语言处理、知识发现(特别地,数据挖掘)、信息检索这些无疑是 CS 领域最好玩的分支了(也是互相紧密联系的),这里将最近有关机器学习和人工智能相关的一些学习资源归一个类:

首先是两个非常棒的 Wikipedia 条目,我也算是 wikipedia 的重度用户了,学习一门东西的时候常常发现是始于 wikipedia 中间经过若干次 google ,然后止于某一本或几本著作。

第一个是“人工智能的历史”(History of Artificial Intelligence),我在讨论组上写道:

而今天看到的这篇文章是我在 wikipedia 浏览至今觉得最好的。文章名为《人工智能的历史》,顺着 AI 发展时间线娓娓道来,中间穿插无数牛人故事,且一波三折大气磅礴,可谓"事实比想象更令人惊讶"。人工智能始于哲学思辨,中间经历了一个没有心理学(尤其是认知神经科学的)的帮助的阶段,仅通过牛人对人类思维的外在表现的归纳、内省,以及数学工具进行探索,其间最令人激动的是 Herbert Simon (决策理论之父,诺奖,跨领域牛人)写的一个自动证明机,证明了罗素的数学原理中的二十几个定理,其中有一个定理比原书中的还要优雅,Simon 的程序用的是启发式搜索,因为公理系统中的证明可以简化为从条件到结论的树状搜索(但由于组合爆炸,所以必须使用启发式剪枝)。后来 Simon 又写了 GPS (General Problem Solver),据说能解决一些能良好形式化的问题,如汉诺塔。但说到底 Simon 的研究毕竟只触及了人类思维的一个很小很小的方面 —— Formal Logic,甚至更狭义一点 Dective Reasoning (即不包含 Inctive Reasoning , Transctive Reasoning (俗称 analogic thinking)。还有诸多比如 Common Sense、Vision、尤其是最为复杂的 Language 、Consciousness 都还谜团未解。还有一个比较有趣的就是有人认为 AI 问题必须要以一个物理的 Body 为支撑,一个能够感受这个世界的物理规则的身体本身就是一个强大的信息来源,基于这个信息来源,人类能够自身与时俱进地总结所谓的 Common-Sense Knowledge (这个就是所谓的 Emboddied Mind 理论。 ),否则像一些老兄直接手动构建 Common-Sense Knowledge Base ,就很傻很天真了,须知人根据感知系统从自然界获取知识是一个动态的自动更新的系统,而手动构建常识库则无异于古老的 Expert System 的做法。当然,以上只总结了很小一部分我个人觉得比较有趣或新颖的,每个人看到的有趣的地方不一样,比如里面相当详细地介绍了神经网络理论的兴衰。所以我强烈建议你看自己一遍,别忘了里面链接到其他地方的链接。

顺便一说,徐宥同学打算找时间把这个条目翻译出来,这是一个相当长的条目,看不动 E 文的等着看翻译吧:)

第二个则是“人工智能”(Artificial Intelligence)。当然,还有机器学习等等。从这些条目出发能够找到许多非常有用和靠谱的深入参考资料。

然后是一些书籍

书籍:

1. 《Programming Collective Intelligence》,近年出的入门好书,培养兴趣是最重要的一环,一上来看大部头很容易被吓走的:P

2. Peter Norvig 的《AI, Modern Approach 2nd》(无争议的领域经典)。

3. 《The Elements of Statistical Learning》,数学性比较强,可以做参考了。

4. 《Foundations of Statistical Natural Language Processing》,自然语言处理领域公认经典。

5. 《Data Mining, Concepts and Techniques》,华裔科学家写的书,相当深入浅出。

6. 《Managing Gigabytes》,信息检索好书。

7. 《Information Theory:Inference and Learning Algorithms》,参考书吧,比较深。

相关数学基础(参考书,不适合拿来通读):

1. 线性代数:这个参考书就不列了,很多。

2. 矩阵数学:《矩阵分析》,Roger Horn。矩阵分析领域无争议的经典。

3. 概率论与统计:《概率论及其应用》,威廉·费勒。也是极牛的书,可数学味道太重,不适合做机器学习的。于是讨论组里的 Du Lei 同学推荐了《All Of Statistics》并说到

机器学习这个方向,统计学也一样非常重要。推荐All of statistics,这是CMU的一本很简洁的教科书,注重概念,简化计算,简化与Machine Learning无关的概念和统计内容,可以说是很好的快速入门材料。

4. 最优化方法:《Nonlinear Programming, 2nd》非线性规划的参考书。《Convex Optimization》凸优化的参考书。此外还有一些书可以参考 wikipedia 上的最优化方法条目。要深入理解机器学习方法的技术细节很多时候(如SVM)需要最优化方法作为铺垫。

王宁同学推荐了好几本书:

《Machine Learning, Tom Michell》, 1997.
老书,牛人。现在看来内容并不算深,很多章节有点到为止的感觉,但是很适合新手(当然,不能"新"到连算法和概率都不知道)入门。比如决策树部分就很精彩,并且这几年没有特别大的进展,所以并不过时。另外,这本书算是对97年前数十年机器学习工作的大综述,参考文献列表极有价值。国内有翻译和影印版,不知道绝版否。

《Modern Information Retrieval, Ricardo Baeza-Yates et al》. 1999
老书,牛人。貌似第一本完整讲述IR的书。可惜IR这些年进展迅猛,这本书略有些过时了。翻翻做参考还是不错的。另外,Ricardo同学现在是Yahoo Research for Europe and Latin Ameria的头头。

《Pattern Classification (2ed)》, Richard O. Duda, Peter E. Hart, David G. Stork
大约也是01年左右的大块头,有影印版,彩色。没读完,但如果想深入学习ML和IR,前三章(介绍,贝叶斯学习,线性分类器)必修。

还有些经典与我只有一面之缘,没有资格评价。另外还有两本小册子,论文集性质的,倒是讲到了了不少前沿和细节,诸如索引如何压缩之类。可惜忘了名字,又被我压在箱底,下次搬家前怕是难见天日了。

(呵呵,想起来一本:《Mining the Web - Discovering Knowledge from Hypertext Data》 )

说一本名气很大的书:《Data Mining: Practical Machine Learning Tools and Techniques》。Weka 的作者写的。可惜内容一般。理论部分太单薄,而实践部分也很脱离实际。DM的入门书已经不少,这一本应该可以不看了。如果要学习了解 Weka ,看文档就好。第二版已经出了,没读过,不清楚。

信息检索方面,Du Lei 同学再次推荐:

信息检索方面的书现在建议看Stanford的那本《Introction to Information Retrieval》,这书刚刚正式出版,内容当然up to date。另外信息检索第一大牛Croft老爷也正在写教科书,应该很快就要面世了。据说是非常pratical的一本书。

对信息检索有兴趣的同学,强烈推荐翟成祥博士在北大的暑期学校课程,这里有全slides和阅读材料:http://net.pku.e.cn/~course/cs410/schele.html

maximzhao 同学推荐了一本机器学习:

加一本书:Bishop, 《Pattern Recognition and Machine Learning》. 没有影印的,但是网上能下到。经典中的经典。Pattern Classification 和这本书是两本必读之书。《Pattern Recognition and Machine Learning》是很新(07年),深入浅出,手不释卷。

最后,关于人工智能方面(特别地,决策与判断),再推荐两本有意思的书,

一本是《Simple Heuristics that Makes Us Smart》

另一本是《Bounded Rationality: The Adaptive Toolbox》

不同于计算机学界所采用的统计机器学习方法,这两本书更多地着眼于人类实际上所采用的认知方式,以下是我在讨论组上写的简介:

这两本都是德国ABC研究小组(一个由计算机科学家、认知科学家、神经科学家、经济学家、数学家、统计学家等组成的跨学科研究团体)集体写的,都是引起领域内广泛关注的书,尤其是前一本,后一本则是对 Herbert Simon (决策科学之父,诺奖获得者)提出的人类理性模型的扩充研究),可以说是把什么是真正的人类智能这个问题提上了台面。核心思想是,我们的大脑根本不能做大量的统计计算,使用fancy的数学手法去解释和预测这个世界,而是通过简单而鲁棒的启发法来面对不确定的世界(比如第一本书中提到的两个后来非常著名的启发法:再认启发法(cognition heuristics)和选择最佳(Take the Best)。当然,这两本书并没有排斥统计方法就是了,数据量大的时候统计优势就出来了,而数据量小的时候统计方法就变得非常糟糕;人类简单的启发法则充分利用生态环境中的规律性(regularities),都做到计算复杂性小且鲁棒。

关于第二本书的简介:

1. 谁是 Herbert Simon

2. 什么是 Bounded Rationality

3. 这本书讲啥的:

我一直觉得人类的决策与判断是一个非常迷人的问题。这本书简单地说可以看作是《决策与判断》的更全面更理论的版本。系统且理论化地介绍人类决策与判断过程中的各种启发式方法(heuristics)及其利弊(为什么他们是最优化方法在信息不足情况下的快捷且鲁棒的逼近,以及为什么在一些情况下会带来糟糕的后果等,比如学过机器学习的都知道朴素贝叶斯方法在许多情况下往往并不比贝叶斯网络效果差,而且还速度快;比如多项式插值的维数越高越容易 overfit,而基于低阶多项式的分段样条插值却被证明是一个非常鲁棒的方案)。

在此提一个书中提到的例子,非常有意思:两个团队被派去设计一个能够在场上接住抛过来的棒球的机器人。第一组做了详细的数学分析,建立了一个相当复杂的抛物线近似模型(因为还要考虑空气阻力之类的原因,所以并非严格抛物线),用于计算球的落点,以便正确地接到球。显然这个方案耗资巨大,而且实际运算也需要时间,大家都知道生物的神经网络中生物电流传输只有百米每秒之内,所以 computational complexity 对于生物来说是个宝贵资源,所以这个方案虽然可行,但不够好。第二组则采访了真正的运动员,听取他们总结自己到底是如何接球的感受,然后他们做了这样一个机器人:这个机器人在球抛出的一开始一半路程啥也不做,等到比较近了才开始跑动,并在跑动中一直保持眼睛于球之间的视角不变,后者就保证了机器人的跑动路线一定会和球的轨迹有交点;整个过程中这个机器人只做非常粗糙的轨迹估算。体会一下你接球的时候是不是眼睛一直都盯着球,然后根据视线角度来调整跑动方向?实际上人类就是这么干的,这就是 heuristics 的力量。

相对于偏向于心理学以及科普的《决策与判断》来说,这本书的理论性更强,引用文献也很多而经典,而且与人工智能和机器学习都有交叉,里面也有不少数学内容,全书由十几个章节构成,每个章节都是由不同的作者写的,类似于 paper 一样的,很严谨,也没啥废话,跟《Psychology of Problem Solving》类似。比较适合 geeks 阅读哈。

另外,对理论的技术细节看不下去的也建议看看《决策与判断》这类书(以及像《别做正常的傻瓜》这样的傻瓜科普读本),对自己在生活中做决策有莫大的好处。人类决策与判断中使用了很多的 heuristics ,很不幸的是,其中许多都是在适应几十万年前的社会环境中建立起来的,并不适合于现代社会,所以了解这些思维中的缺点、盲点,对自己成为一个良好的决策者有很大的好处,而且这本身也是一个非常有趣的领域。

(完)

㈢ 人工智能应用在哪些方面呢能举几个典型的例子吗

1.智能机器人 智能机器人是一种具有感知能力、思维能力和行为能力的新一代机器人。这种机器人能够主动适应外界环境变化,并能够通过学习丰富自己的知识,提高自己的工作能力。目前,已研制出了肢体和行为功能灵活,能根据思维机构的命令完成许多复杂操作,能回答各种复杂问题的机器人。
2.智能网络 智能网络方面的两个重要研究内容分别是智能搜索引擎和智能网格。智能搜索引擎是一种能够为用户提供相关度排序、角色登记、兴趣识别、内容的语义理解、智能化信息过滤和推送等人性化服务的搜索引擎。智能网格是一种与物理结构和物理分布无关的网络环境,它能够实现各种资源的充分共享,能够为不同用户提供个性化的网络服务。可以形象地把智能网格比喻为一个超级大脑,其中的各种计算资源、存储资源、通信资源、软件资源、信息资源、知识资源等都像大脑的神经元细胞一样能够相互作用、传导和传递,实现资源的共享、融合和新生。
3.智能检索 智能检索是指利用人工智能的方法从大量信息中尽快找到所需要的信息或知识。随着科学技术的迅速发展和信息手段的快速提升,在各种数据库,尤其是因特网上存放着大量的、甚至是海量的信息或知识。面对这种信息海洋,如果还用传统的人工方式进行检索,已经很不现实。因此,迫切需要相应的智能检索技术和智能检索系统来帮助人们快速、准确、有效地完成检索工作。
4.智能游戏 游戏是一种娱乐活动。游戏技术与计算机技术结合产生了“计算机游戏”或“视频游戏”,与网络技术结合产生了“网络游戏”,与人工智能技术结合产生了智能游戏

㈣ 人工智能语音系统是什么

晚上和同事聊了会天,感觉精神挺好的,写下这篇文章记录自己的一些思想

目前语音交互被市场炒的火热,大小公司做此类产品的层出不穷,首先我觉得要感谢siri给大家做了这么好的平台建设,其实纵观计算机领域,语音交互这一块是起起伏伏,总是隔几年就会被炒火一次,可是火不了一段时间又消沉了。siri的到来,貌似给大家的感觉是语音时代已经到来了,而且很快会才成为人们的用户行为习惯了。

可是不知道大家有没有真正想过siri?它的优势、技术核心是什么?

以下是我自己的一些理解:
从前台和后台来分析siri,前台分为UI界面以及语音设别。Siri采用Nuance的语音设别和语义合成技术,类似中国的科大讯飞。这个东西需要一批牛人积累多年才能生产出来,什么信号处理、模式识别、概率统计、信息论、数据挖掘、人体听觉机理、人工智能等等计算机、数学、统计学、生物领域nb的技术都得用上,这个没有什么好说的了。后台即为语义识别技术,这一块其实是技术的核心点,我不知道这些技术全是SRI自己研究出来的,还是借鉴了其他搜索类公司的技术。但是不论如何,这一块都是一个核心地方。其实,这一块的技术就是几大搜索类公司的核心技术。一是以google和网络为代表的网页搜索技术,二是以wolfarm alpha为代表的知识计算技术,三是wikipedia为代表的人工知识库技术。网页搜索通过网络机器人获取每个科访问网站的内容,这些数据被分解成一个索引,这样便可以根据内容来查找页面,用户输入一个查询,查找索引找到相关内容的页面,返回的为相关内容的列表;知识计算技术,是将所有可以获得信息建立成一个有组织的数据库,然后再利用算法进行处理,最终构造成类似与google这样的搜索工具。其实说白了就和网络前几年一直鼓吹的框计算一样,只要把东西放到框内,什么东西都可以给你解决。例如你在网络输入天气,它会显示你所在城市的天气情况,而不是以往常的网页形式展现。知识计算技术给出的答案更加精确,更加的唯一性;人工知识库技术,以维基网络为例,它采用词条和主题为单位,利用人工的力量收集知识。因此这样的知识结构化程度高,更加准确并且人性化,可同时它的知识体系会受到限制。Siri结合三项搜索类技术,根据不同的需要,利用相应的技术给出答案。其实网上经常大家说的人工智能、上下文识别、自动学习技术,这些都包含在这三项搜索技术里面了,仔细想想这些搜索是否会记忆人的行为模式、是否会上下文识别语义、是否会人机智能交互。忘了,Siri还有一个技术就是知识推荐技术,类似于大众点评、携程这样的网站,查询好吃的、机票之类的,会给出一个推荐结果。由于国外的很多类似软件api是开放的,所以siri在知识推荐这一块等于利用这些开放的api云服务了。

Siri的优势我个人觉得有两方面,一是语音交互,实现语音控制功能,这是人体本能机理的发展趋势,人类的控制欲很强,肢体控制——>声音控制——>脑电波控制…。二是搜索方式,想想如果用google,你搜索的步骤,在google输入问题——>给出一推结果——>一个个筛选自己需要的结果——>得出答案。而siri只有两步,输入问题——>得到结果。

说了这么一大段技术分析的话,只是为了更好的去思考国内这些智能语音交互产品的未来。
据我所知,目前做这一块的有讯飞语点、智能360、快说、口袋语音、我问问、虫洞助手、小i机器人、009、开心熊宝、小唐龙、云助理,还有小米手机自带的语音助手,以及一系列模仿siri的山寨类软件。其中这些产品分为五类,1、讯飞语点、智能360、快说、口袋语音、我问问、虫洞助手 2、小i机器人 3、009、开心熊宝、小唐龙 4、云助理 5、手机集成的语音助手以及山寨siri。

我针对每一类谈一谈自己的看法。
第一类首先它的未来是死的,除非有本质性的改革。从技术上来看,目前这些产品采用的语音识别和语义合成技术为讯飞、谷歌、盛大等提供,如果哪天讯飞要按照装机量收费了,而产品却没有盈利,这些产品必然会成为讯飞语点的手下败将,可矛盾的是讯飞根本没有精力去不断优化讯飞语点(从讯飞语点的产品更新过程就可以看出来),毕竟讯飞的主要目的不是在这一块,讯飞语点只是让别人知道讯飞有这么个东西而已。语音技术暂且不谈,就上面说到的siri利用的三种搜索技术,着实会让这些产品望尘莫及。没有一批计算机领域的顶尖专家,在这一块是很难有突破的。因此,这些产品的语义识别根本没法能够得到质的突变,只会随着语料的不断增加而越来越乱。从产品上来看,用户的粘度不够,用户过了新鲜期很有可能会卸载掉。作为一款移动应用,如果没有利用移动、云、社交三个要素,死的可能性极大。

第二类是小i机器人,我很看好这个产品,当然我指的不是手机客户端的那个小i机器人了。小i机器人在语义识别这一块在国内是领先,我不知道小i是不是有很多专家,但是人家多年的经验积累绝对是有很强大的技术背景。小i在产品展现方式上很简单,没有特别的设计和思路,但是小i的市场思路确是特别的清晰。小i机器人应用在微博、移动、政府、银行、运营商等等领域,作为智能机器人的形象来推广。可想而知,小i在语义识别技术上面的技术积累有多雄厚。虽然比不上siri,但是它选择的契机特别好,专注于各行业领域,找准需要智能机器人的机会,从而巧妙的相结合。不仅仅能满足用户需求,还有盈利。可是也有个问题,如果后期等到国内行业应用类的api开放了,再加上网络、谷歌等公司的介入,那么小i还有盈利的空间吗?

第三类,是娱乐类的智能语音产品。009、开心熊宝、小唐龙,三者类似,以娱乐化的形式展现产品,同时加入语音交互。给用户的印象是,智能宠物。这样的产品如果走线上的话,结果很可能也会死,因为用户的粘度不高。游戏和应用结合起来,导致娱乐性不强,应用性不明显,搞成游戏不游戏、应用不应用的两不像。(但是我想提一下开心熊宝,由于它的用户专注于小朋友,目标用户明确,更加专业化,所以有别于其他两款软件是很有可能会朝好的方向发展的)。可是如果它们走线下的话,有可能会有生存的机会。发展智能宠物,走实体路线。但是这一块的技术门槛也比较高,还得看公司的实力和规划了。

第四类,云助理也是一款有意思的产品。我理解的是它想做成,服务在云端,推送给个人的私人助理软件(不知道他们内部是怎样考虑的)。将语义识别放到云端,给用户展现的只是一个简单的助理形象本体,通过助理的帮忙完成一系列功能。其实它的私人助理思路和009的狗、开心熊宝的小熊,小唐龙的中国龙是差不多的,这一点并不新颖。我比较看重的是它提到的云服务概念。目前,他们肯定做不到构建语义识别云,但是有这个理念是好的。如果真正能构成语义识别云,再将各行业api集成在一起,那么无论什么终端载体都可以接受这些信息,那样必然是未来的一个趋势。只是,我担心的是这样的工程好像不是一家小公司或者说几家公司可以做出来的。

第五类,不说了,大家都懂的。

其实每家公司都不好做,但是每家公司都觉得很有机会,这就是魅力所在。

我觉得首先得找准一个方向,专注一个点,做一些自己能做的事情,别老想着那么大的宏伟蓝图,那些留给NB的公司去干吧。小i、开心熊宝就是很好的榜样。发挥自己的优势,找到差异化,然后一头扎进去,做到专业,只有先生存下去才有发展的机会。
哎,写的真累。自己的知识有限,分析的很浅薄。望读者见谅。

㈤ 如何查找有关“人工智能”方面的文献写出详细的检索策略

有很多网站是专门“卖”这些文献的,我记得有万方数据什么,那个可以搜索文献,但是都是要付费的,不知道你是不是大学生,一般学校会为学生老师提供搜索,并且是免费的,就是学校买的

㈥ 智能搜索是什么

智能搜索引擎 智能搜索引擎是结合了人工智能技术的新一代搜索引擎。他除了能提供传统的快速检索、相关度排序等功能,还能提供用户角色登记、用户兴趣自动识别、内容的语义理解、智能信息化过滤和推送等功能。
智能搜索引擎设计追求的目标是:根据用户的请求,从可以获得的网络资源中检索出对用户最有价值的信息。
智能搜索引擎具有信息服务的智能化、人性化特征,允许网民采用自然语言进行信息的检索,为他们提供更方便、更确切的搜索服务。

㈦ 搜索引擎技术的智能技术

网络机器人(Robot)又被称作Spider、Worm或Random,核心目的是为获取Internet上的信息。一般定义为“一个在网络上检索文件且自动跟踪该文件的超文本结构并循环检索被参照的所有文件的软件”。机器人利用主页中的超文本链接遍历WWW,通过URL引用从一个HTML文档爬行到另一个HTML文档。网上机器人收集到的信息可有多种用途,如建立索引、HIML文件合法性的验证、URL链接点验证与确认、监控与获取更新信息、站点镜像等。
机器人安在网上爬行,因此需要建立一个URL列表来记录访问的轨迹。它使用超文本,指向其他文档的URL是隐藏在文档中,需要从中分析提取URL,机器人一般都用于生成索引数据库。所有WWW的搜索程序都有如下的工作步骤:
(1)机器人从起始URL列表中取出URL并从网上读取其指向的内容;
(2)从每一个文档中提取某些信息(如关键字)并放入索引数据库中;
(3)从文档中提取指向其他文档的URL,并加入到URL列表中;
(4)重复上述3个步骤,直到再没有新的URL出现或超出了某些限制(时间或磁盘空间);
(5)给索引数据库加上检索接口,向网上用户发布或提供给用户检索。
搜索算法一般有深度优先和广度优先两种基本的搜索策略。机器人以URL列表存取的方式决定搜索策略:先进先出,则形成广度优先搜索,当起始列表包含有大量的WWW服务器地址时,广度优先搜索将产生一个很好的初始结果,但很难深入到服务器中去;先进后出,则形成深度优先搜索,这样能产生较好的文档分布,更容易发现文档的结构,即找到最大数目的交叉引用。也可以采用遍历搜索的方法,就是直接将32位的IP地址变化,逐个搜索整个Internet。
量贩式搜索引擎优化是一个技术含量很高的网络应用系统。它包括网络技术、数据库技术动标引技术、检索技术、自动分类技术,机器学习等人工智能技术。

㈧ 请问:人工智能与智能检索有什么关系

人工智能是指机械其有人的一定的像人类某方面智慧的能力.
智能检索是指检索能根据用户的输入的检索词而进行相关的,有选择地进行,是将人工智能的应用于检索方面.

㈨ 智能检索必须解决的问题有哪些

要完成信息检索的匹配与选择,需要完成六方面的工作:
一、分析研究课题,明确检索要求课题的主题内容、研究要点、学科范围、语种范围、时间范围、文献类型等。
二、选择信息检索系统,确定检索途径
1、选择信息检索系统的方法:
(1)在信息检索系统齐全的情况下,首先使用信息检索工具指南来指导选择;
(2)在没有信息检索工具指南的情况下,可以采用浏览图书馆、信息所的信息检索工具室所陈列的信息检索工具的方式进行选择;
(3)从所熟悉的信息检索工具中选择;
(4)主动向工作人员请教;
(5)通过网络在线帮助选择。
2、选择信息检索系统的原则:
(1)收录的文献信息需含盖检索课题的主题内容;
(2)就近原则,方便查阅;
(3)尽可能质量较高、收录文献信息量大、报道及时、索引齐全、使用方便;
(4)记录来源,文献类型,文种尽量满足检索课题的要求;
(5)数据库是否有对应的印刷型版本;
(6)根据经济条件选择信息检索系统;
(7)根据对检索信息熟悉的程度选择;
(8)选择查出的信息相关度高的网络搜索引擎。
三、选择检索词确定检索词的基本方法:
选择规范化的检索词;使用各学科在国际上通用的、国外文献中出现过的术语作检索词;找出课题涉及的隐性主题概念作检索词;选择课题核心概念作检索词;注意检索词的缩写词、词形变化以及英美的不同拼法;联机方式确定检索词。
四、制定检索策略,查阅检索工具
1、制定检索策略的前提条件是要了解信息检索系统的基本性能,基础是要明确检索课题的内容要求和检索目的,关键是要正确选择检索词和合理使用逻辑组配。
2、产生误检的原因可能有:一词多义的检索词的使用;检索词与英美人的姓名、地址名称、期刊名称相同;不严格的位置算符的运用;检索式中没有使用逻辑非运算;截词运算不恰当;组号前忘记输入指令“s”;逻辑运算符号前后未空格;括号使用不正确;从错误的组号中打印检索结果;检索式中检索概念太少。
3、产生漏检的原因或检索结果为零的原因可能有:没有使用足够的同义词和近义词或隐含概念;位置算符用得过严、过多;逻辑“与”用得太多;后缀代码限制得太严;检索工具选择不恰当;截词运算不恰当;单词拼写错误、文档号错误、组号错误、括号不匹配等。
4、提高查准率的方法有:使用下位概念检索;将检索词的检索范围限在篇名、叙词和文摘字段;使用逻辑“与”或逻辑“非”;运用限制选择功能;进行进阶检或高级检索。5、提高查全率的方法有:选择全字段中检索;减少对文献外表特征的限定;使用逻辑“或”;利用截词检索;使用检索词的上位概念进行检索;把(W)算符改成(1N),(2N);进入更合适的数据库查找。
五、处理检索结果将所获得的检索结果加以系统整理,筛选出符合课题要求的相关文献信息,选择检索结果的著录格式,辨认文献类型、文种、著者、篇名、内容、出处等项记录内容,输出检索结果。
六、原始文献的获取
1、利用二次文献检索工具获取原始文献。
2、利用馆藏目录和联合目录获取原始文献。
3、利用文献出版发行机构获取原始文献。
。4、利用文献著者获取原始文献。
5、利用网络获取原始文献参考。