人工智慧索引
㈠ 信息檢索的本質為什麼是人工智慧
好問題,馬一下,稍候再來回答。
㈡ 人工智慧有什麼好的參考書么
Peter Norvig 的《AI, Modern Approach 2nd》(無爭議的領域經典)
Bishop, 《Pattern Recognition and Machine Learning》. 沒有影印的,但是網上能下到。經典中的經典。Pattern Classification 和這本書是兩本必讀之書。《Pattern Recognition and Machine Learning》是很新(07年),深入淺出,手不釋卷。
推薦兩本有意思的書,
一本是《Simple Heuristics that Makes Us Smart》
另一本是《Bounded Rationality: The Adaptive Toolbox》
---------------------------------------------------------------------
<從CSDN上轉載的>
機器學習與人工智慧學習資源導引
我經常在 TopLanguage 討論組上推薦一些書籍,也經常問裡面的牛人們搜羅一些有關的資料,人工智慧、機器學習、自然語言處理、知識發現(特別地,數據挖掘)、信息檢索這些無疑是 CS 領域最好玩的分支了(也是互相緊密聯系的),這里將最近有關機器學習和人工智慧相關的一些學習資源歸一個類:
首先是兩個非常棒的 Wikipedia 條目,我也算是 wikipedia 的重度用戶了,學習一門東西的時候常常發現是始於 wikipedia 中間經過若干次 google ,然後止於某一本或幾本著作。
第一個是「人工智慧的歷史」(History of Artificial Intelligence),我在討論組上寫道:
而今天看到的這篇文章是我在 wikipedia 瀏覽至今覺得最好的。文章名為《人工智慧的歷史》,順著 AI 發展時間線娓娓道來,中間穿插無數牛人故事,且一波三折大氣磅礴,可謂"事實比想像更令人驚訝"。人工智慧始於哲學思辨,中間經歷了一個沒有心理學(尤其是認知神經科學的)的幫助的階段,僅通過牛人對人類思維的外在表現的歸納、內省,以及數學工具進行探索,其間最令人激動的是 Herbert Simon (決策理論之父,諾獎,跨領域牛人)寫的一個自動證明機,證明了羅素的數學原理中的二十幾個定理,其中有一個定理比原書中的還要優雅,Simon 的程序用的是啟發式搜索,因為公理系統中的證明可以簡化為從條件到結論的樹狀搜索(但由於組合爆炸,所以必須使用啟發式剪枝)。後來 Simon 又寫了 GPS (General Problem Solver),據說能解決一些能良好形式化的問題,如漢諾塔。但說到底 Simon 的研究畢竟只觸及了人類思維的一個很小很小的方面 —— Formal Logic,甚至更狹義一點 Dective Reasoning (即不包含 Inctive Reasoning , Transctive Reasoning (俗稱 analogic thinking)。還有諸多比如 Common Sense、Vision、尤其是最為復雜的 Language 、Consciousness 都還謎團未解。還有一個比較有趣的就是有人認為 AI 問題必須要以一個物理的 Body 為支撐,一個能夠感受這個世界的物理規則的身體本身就是一個強大的信息來源,基於這個信息來源,人類能夠自身與時俱進地總結所謂的 Common-Sense Knowledge (這個就是所謂的 Emboddied Mind 理論。 ),否則像一些老兄直接手動構建 Common-Sense Knowledge Base ,就很傻很天真了,須知人根據感知系統從自然界獲取知識是一個動態的自動更新的系統,而手動構建常識庫則無異於古老的 Expert System 的做法。當然,以上只總結了很小一部分我個人覺得比較有趣或新穎的,每個人看到的有趣的地方不一樣,比如裡面相當詳細地介紹了神經網路理論的興衰。所以我強烈建議你看自己一遍,別忘了裡面鏈接到其他地方的鏈接。
順便一說,徐宥同學打算找時間把這個條目翻譯出來,這是一個相當長的條目,看不動 E 文的等著看翻譯吧:)
第二個則是「人工智慧」(Artificial Intelligence)。當然,還有機器學習等等。從這些條目出發能夠找到許多非常有用和靠譜的深入參考資料。
然後是一些書籍
書籍:
1. 《Programming Collective Intelligence》,近年出的入門好書,培養興趣是最重要的一環,一上來看大部頭很容易被嚇走的:P
2. Peter Norvig 的《AI, Modern Approach 2nd》(無爭議的領域經典)。
3. 《The Elements of Statistical Learning》,數學性比較強,可以做參考了。
4. 《Foundations of Statistical Natural Language Processing》,自然語言處理領域公認經典。
5. 《Data Mining, Concepts and Techniques》,華裔科學家寫的書,相當深入淺出。
6. 《Managing Gigabytes》,信息檢索好書。
7. 《Information Theory:Inference and Learning Algorithms》,參考書吧,比較深。
相關數學基礎(參考書,不適合拿來通讀):
1. 線性代數:這個參考書就不列了,很多。
2. 矩陣數學:《矩陣分析》,Roger Horn。矩陣分析領域無爭議的經典。
3. 概率論與統計:《概率論及其應用》,威廉·費勒。也是極牛的書,可數學味道太重,不適合做機器學習的。於是討論組里的 Du Lei 同學推薦了《All Of Statistics》並說到
機器學習這個方向,統計學也一樣非常重要。推薦All of statistics,這是CMU的一本很簡潔的教科書,注重概念,簡化計算,簡化與Machine Learning無關的概念和統計內容,可以說是很好的快速入門材料。
4. 最優化方法:《Nonlinear Programming, 2nd》非線性規劃的參考書。《Convex Optimization》凸優化的參考書。此外還有一些書可以參考 wikipedia 上的最優化方法條目。要深入理解機器學習方法的技術細節很多時候(如SVM)需要最優化方法作為鋪墊。
王寧同學推薦了好幾本書:
《Machine Learning, Tom Michell》, 1997.
老書,牛人。現在看來內容並不算深,很多章節有點到為止的感覺,但是很適合新手(當然,不能"新"到連演算法和概率都不知道)入門。比如決策樹部分就很精彩,並且這幾年沒有特別大的進展,所以並不過時。另外,這本書算是對97年前數十年機器學習工作的大綜述,參考文獻列表極有價值。國內有翻譯和影印版,不知道絕版否。
《Modern Information Retrieval, Ricardo Baeza-Yates et al》. 1999
老書,牛人。貌似第一本完整講述IR的書。可惜IR這些年進展迅猛,這本書略有些過時了。翻翻做參考還是不錯的。另外,Ricardo同學現在是Yahoo Research for Europe and Latin Ameria的頭頭。
《Pattern Classification (2ed)》, Richard O. Duda, Peter E. Hart, David G. Stork
大約也是01年左右的大塊頭,有影印版,彩色。沒讀完,但如果想深入學習ML和IR,前三章(介紹,貝葉斯學習,線性分類器)必修。
還有些經典與我只有一面之緣,沒有資格評價。另外還有兩本小冊子,論文集性質的,倒是講到了了不少前沿和細節,諸如索引如何壓縮之類。可惜忘了名字,又被我壓在箱底,下次搬家前怕是難見天日了。
(呵呵,想起來一本:《Mining the Web - Discovering Knowledge from Hypertext Data》 )
說一本名氣很大的書:《Data Mining: Practical Machine Learning Tools and Techniques》。Weka 的作者寫的。可惜內容一般。理論部分太單薄,而實踐部分也很脫離實際。DM的入門書已經不少,這一本應該可以不看了。如果要學習了解 Weka ,看文檔就好。第二版已經出了,沒讀過,不清楚。
信息檢索方面,Du Lei 同學再次推薦:
信息檢索方面的書現在建議看Stanford的那本《Introction to Information Retrieval》,這書剛剛正式出版,內容當然up to date。另外信息檢索第一大牛Croft老爺也正在寫教科書,應該很快就要面世了。據說是非常pratical的一本書。
對信息檢索有興趣的同學,強烈推薦翟成祥博士在北大的暑期學校課程,這里有全slides和閱讀材料:http://net.pku.e.cn/~course/cs410/schele.html
maximzhao 同學推薦了一本機器學習:
加一本書:Bishop, 《Pattern Recognition and Machine Learning》. 沒有影印的,但是網上能下到。經典中的經典。Pattern Classification 和這本書是兩本必讀之書。《Pattern Recognition and Machine Learning》是很新(07年),深入淺出,手不釋卷。
最後,關於人工智慧方面(特別地,決策與判斷),再推薦兩本有意思的書,
一本是《Simple Heuristics that Makes Us Smart》
另一本是《Bounded Rationality: The Adaptive Toolbox》
不同於計算機學界所採用的統計機器學習方法,這兩本書更多地著眼於人類實際上所採用的認知方式,以下是我在討論組上寫的簡介:
這兩本都是德國ABC研究小組(一個由計算機科學家、認知科學家、神經科學家、經濟學家、數學家、統計學家等組成的跨學科研究團體)集體寫的,都是引起領域內廣泛關注的書,尤其是前一本,後一本則是對 Herbert Simon (決策科學之父,諾獎獲得者)提出的人類理性模型的擴充研究),可以說是把什麼是真正的人類智能這個問題提上了檯面。核心思想是,我們的大腦根本不能做大量的統計計算,使用fancy的數學手法去解釋和預測這個世界,而是通過簡單而魯棒的啟發法來面對不確定的世界(比如第一本書中提到的兩個後來非常著名的啟發法:再認啟發法(cognition heuristics)和選擇最佳(Take the Best)。當然,這兩本書並沒有排斥統計方法就是了,數據量大的時候統計優勢就出來了,而數據量小的時候統計方法就變得非常糟糕;人類簡單的啟發法則充分利用生態環境中的規律性(regularities),都做到計算復雜性小且魯棒。
關於第二本書的簡介:
1. 誰是 Herbert Simon
2. 什麼是 Bounded Rationality
3. 這本書講啥的:
我一直覺得人類的決策與判斷是一個非常迷人的問題。這本書簡單地說可以看作是《決策與判斷》的更全面更理論的版本。系統且理論化地介紹人類決策與判斷過程中的各種啟發式方法(heuristics)及其利弊(為什麼他們是最優化方法在信息不足情況下的快捷且魯棒的逼近,以及為什麼在一些情況下會帶來糟糕的後果等,比如學過機器學習的都知道樸素貝葉斯方法在許多情況下往往並不比貝葉斯網路效果差,而且還速度快;比如多項式插值的維數越高越容易 overfit,而基於低階多項式的分段樣條插值卻被證明是一個非常魯棒的方案)。
在此提一個書中提到的例子,非常有意思:兩個團隊被派去設計一個能夠在場上接住拋過來的棒球的機器人。第一組做了詳細的數學分析,建立了一個相當復雜的拋物線近似模型(因為還要考慮空氣阻力之類的原因,所以並非嚴格拋物線),用於計算球的落點,以便正確地接到球。顯然這個方案耗資巨大,而且實際運算也需要時間,大家都知道生物的神經網路中生物電流傳輸只有百米每秒之內,所以 computational complexity 對於生物來說是個寶貴資源,所以這個方案雖然可行,但不夠好。第二組則采訪了真正的運動員,聽取他們總結自己到底是如何接球的感受,然後他們做了這樣一個機器人:這個機器人在球拋出的一開始一半路程啥也不做,等到比較近了才開始跑動,並在跑動中一直保持眼睛於球之間的視角不變,後者就保證了機器人的跑動路線一定會和球的軌跡有交點;整個過程中這個機器人只做非常粗糙的軌跡估算。體會一下你接球的時候是不是眼睛一直都盯著球,然後根據視線角度來調整跑動方向?實際上人類就是這么乾的,這就是 heuristics 的力量。
相對於偏向於心理學以及科普的《決策與判斷》來說,這本書的理論性更強,引用文獻也很多而經典,而且與人工智慧和機器學習都有交叉,裡面也有不少數學內容,全書由十幾個章節構成,每個章節都是由不同的作者寫的,類似於 paper 一樣的,很嚴謹,也沒啥廢話,跟《Psychology of Problem Solving》類似。比較適合 geeks 閱讀哈。
另外,對理論的技術細節看不下去的也建議看看《決策與判斷》這類書(以及像《別做正常的傻瓜》這樣的傻瓜科普讀本),對自己在生活中做決策有莫大的好處。人類決策與判斷中使用了很多的 heuristics ,很不幸的是,其中許多都是在適應幾十萬年前的社會環境中建立起來的,並不適合於現代社會,所以了解這些思維中的缺點、盲點,對自己成為一個良好的決策者有很大的好處,而且這本身也是一個非常有趣的領域。
(完)
㈢ 人工智慧應用在哪些方面呢能舉幾個典型的例子嗎
1.智能機器人 智能機器人是一種具有感知能力、思維能力和行為能力的新一代機器人。這種機器人能夠主動適應外界環境變化,並能夠通過學習豐富自己的知識,提高自己的工作能力。目前,已研製出了肢體和行為功能靈活,能根據思維機構的命令完成許多復雜操作,能回答各種復雜問題的機器人。
2.智能網路 智能網路方面的兩個重要研究內容分別是智能搜索引擎和智能網格。智能搜索引擎是一種能夠為用戶提供相關度排序、角色登記、興趣識別、內容的語義理解、智能化信息過濾和推送等人性化服務的搜索引擎。智能網格是一種與物理結構和物理分布無關的網路環境,它能夠實現各種資源的充分共享,能夠為不同用戶提供個性化的網路服務。可以形象地把智能網格比喻為一個超級大腦,其中的各種計算資源、存儲資源、通信資源、軟體資源、信息資源、知識資源等都像大腦的神經元細胞一樣能夠相互作用、傳導和傳遞,實現資源的共享、融合和新生。
3.智能檢索 智能檢索是指利用人工智慧的方法從大量信息中盡快找到所需要的信息或知識。隨著科學技術的迅速發展和信息手段的快速提升,在各種資料庫,尤其是網際網路上存放著大量的、甚至是海量的信息或知識。面對這種信息海洋,如果還用傳統的人工方式進行檢索,已經很不現實。因此,迫切需要相應的智能檢索技術和智能檢索系統來幫助人們快速、准確、有效地完成檢索工作。
4.智能游戲 游戲是一種娛樂活動。游戲技術與計算機技術結合產生了「計算機游戲」或「視頻游戲」,與網路技術結合產生了「網路游戲」,與人工智慧技術結合產生了智能游戲
㈣ 人工智慧語音系統是什麼
晚上和同事聊了會天,感覺精神挺好的,寫下這篇文章記錄自己的一些思想
目前語音交互被市場炒的火熱,大小公司做此類產品的層出不窮,首先我覺得要感謝siri給大家做了這么好的平台建設,其實縱觀計算機領域,語音交互這一塊是起起伏伏,總是隔幾年就會被炒火一次,可是火不了一段時間又消沉了。siri的到來,貌似給大家的感覺是語音時代已經到來了,而且很快會才成為人們的用戶行為習慣了。
可是不知道大家有沒有真正想過siri?它的優勢、技術核心是什麼?
以下是我自己的一些理解:
從前台和後台來分析siri,前台分為UI界面以及語音設別。Siri採用Nuance的語音設別和語義合成技術,類似中國的科大訊飛。這個東西需要一批牛人積累多年才能生產出來,什麼信號處理、模式識別、概率統計、資訊理論、數據挖掘、人體聽覺機理、人工智慧等等計算機、數學、統計學、生物領域nb的技術都得用上,這個沒有什麼好說的了。後台即為語義識別技術,這一塊其實是技術的核心點,我不知道這些技術全是SRI自己研究出來的,還是借鑒了其他搜索類公司的技術。但是不論如何,這一塊都是一個核心地方。其實,這一塊的技術就是幾大搜索類公司的核心技術。一是以google和網路為代表的網頁搜索技術,二是以wolfarm alpha為代表的知識計算技術,三是wikipedia為代表的人工知識庫技術。網頁搜索通過網路機器人獲取每個科訪問網站的內容,這些數據被分解成一個索引,這樣便可以根據內容來查找頁面,用戶輸入一個查詢,查找索引找到相關內容的頁面,返回的為相關內容的列表;知識計算技術,是將所有可以獲得信息建立成一個有組織的資料庫,然後再利用演算法進行處理,最終構造成類似與google這樣的搜索工具。其實說白了就和網路前幾年一直鼓吹的框計算一樣,只要把東西放到框內,什麼東西都可以給你解決。例如你在網路輸入天氣,它會顯示你所在城市的天氣情況,而不是以往常的網頁形式展現。知識計算技術給出的答案更加精確,更加的唯一性;人工知識庫技術,以維基網路為例,它採用詞條和主題為單位,利用人工的力量收集知識。因此這樣的知識結構化程度高,更加准確並且人性化,可同時它的知識體系會受到限制。Siri結合三項搜索類技術,根據不同的需要,利用相應的技術給出答案。其實網上經常大家說的人工智慧、上下文識別、自動學習技術,這些都包含在這三項搜索技術裡面了,仔細想想這些搜索是否會記憶人的行為模式、是否會上下文識別語義、是否會人機智能交互。忘了,Siri還有一個技術就是知識推薦技術,類似於大眾點評、攜程這樣的網站,查詢好吃的、機票之類的,會給出一個推薦結果。由於國外的很多類似軟體api是開放的,所以siri在知識推薦這一塊等於利用這些開放的api雲服務了。
Siri的優勢我個人覺得有兩方面,一是語音交互,實現語音控制功能,這是人體本能機理的發展趨勢,人類的控制欲很強,肢體控制——>聲音控制——>腦電波控制…。二是搜索方式,想想如果用google,你搜索的步驟,在google輸入問題——>給出一推結果——>一個個篩選自己需要的結果——>得出答案。而siri只有兩步,輸入問題——>得到結果。
說了這么一大段技術分析的話,只是為了更好的去思考國內這些智能語音交互產品的未來。
據我所知,目前做這一塊的有訊飛語點、智能360、快說、口袋語音、我問問、蟲洞助手、小i機器人、009、開心熊寶、小唐龍、雲助理,還有小米手機自帶的語音助手,以及一系列模仿siri的山寨類軟體。其中這些產品分為五類,1、訊飛語點、智能360、快說、口袋語音、我問問、蟲洞助手 2、小i機器人 3、009、開心熊寶、小唐龍 4、雲助理 5、手機集成的語音助手以及山寨siri。
我針對每一類談一談自己的看法。
第一類首先它的未來是死的,除非有本質性的改革。從技術上來看,目前這些產品採用的語音識別和語義合成技術為訊飛、谷歌、盛大等提供,如果哪天訊飛要按照裝機量收費了,而產品卻沒有盈利,這些產品必然會成為訊飛語點的手下敗將,可矛盾的是訊飛根本沒有精力去不斷優化訊飛語點(從訊飛語點的產品更新過程就可以看出來),畢竟訊飛的主要目的不是在這一塊,訊飛語點只是讓別人知道訊飛有這么個東西而已。語音技術暫且不談,就上面說到的siri利用的三種搜索技術,著實會讓這些產品望塵莫及。沒有一批計算機領域的頂尖專家,在這一塊是很難有突破的。因此,這些產品的語義識別根本沒法能夠得到質的突變,只會隨著語料的不斷增加而越來越亂。從產品上來看,用戶的粘度不夠,用戶過了新鮮期很有可能會卸載掉。作為一款移動應用,如果沒有利用移動、雲、社交三個要素,死的可能性極大。
第二類是小i機器人,我很看好這個產品,當然我指的不是手機客戶端的那個小i機器人了。小i機器人在語義識別這一塊在國內是領先,我不知道小i是不是有很多專家,但是人家多年的經驗積累絕對是有很強大的技術背景。小i在產品展現方式上很簡單,沒有特別的設計和思路,但是小i的市場思路確是特別的清晰。小i機器人應用在微博、移動、政府、銀行、運營商等等領域,作為智能機器人的形象來推廣。可想而知,小i在語義識別技術上面的技術積累有多雄厚。雖然比不上siri,但是它選擇的契機特別好,專注於各行業領域,找准需要智能機器人的機會,從而巧妙的相結合。不僅僅能滿足用戶需求,還有盈利。可是也有個問題,如果後期等到國內行業應用類的api開放了,再加上網路、谷歌等公司的介入,那麼小i還有盈利的空間嗎?
第三類,是娛樂類的智能語音產品。009、開心熊寶、小唐龍,三者類似,以娛樂化的形式展現產品,同時加入語音交互。給用戶的印象是,智能寵物。這樣的產品如果走線上的話,結果很可能也會死,因為用戶的粘度不高。游戲和應用結合起來,導致娛樂性不強,應用性不明顯,搞成游戲不游戲、應用不應用的兩不像。(但是我想提一下開心熊寶,由於它的用戶專注於小朋友,目標用戶明確,更加專業化,所以有別於其他兩款軟體是很有可能會朝好的方向發展的)。可是如果它們走線下的話,有可能會有生存的機會。發展智能寵物,走實體路線。但是這一塊的技術門檻也比較高,還得看公司的實力和規劃了。
第四類,雲助理也是一款有意思的產品。我理解的是它想做成,服務在雲端,推送給個人的私人助理軟體(不知道他們內部是怎樣考慮的)。將語義識別放到雲端,給用戶展現的只是一個簡單的助理形象本體,通過助理的幫忙完成一系列功能。其實它的私人助理思路和009的狗、開心熊寶的小熊,小唐龍的中國龍是差不多的,這一點並不新穎。我比較看重的是它提到的雲服務概念。目前,他們肯定做不到構建語義識別雲,但是有這個理念是好的。如果真正能構成語義識別雲,再將各行業api集成在一起,那麼無論什麼終端載體都可以接受這些信息,那樣必然是未來的一個趨勢。只是,我擔心的是這樣的工程好像不是一家小公司或者說幾家公司可以做出來的。
第五類,不說了,大家都懂的。
其實每家公司都不好做,但是每家公司都覺得很有機會,這就是魅力所在。
我覺得首先得找准一個方向,專注一個點,做一些自己能做的事情,別老想著那麼大的宏偉藍圖,那些留給NB的公司去干吧。小i、開心熊寶就是很好的榜樣。發揮自己的優勢,找到差異化,然後一頭扎進去,做到專業,只有先生存下去才有發展的機會。
哎,寫的真累。自己的知識有限,分析的很淺薄。望讀者見諒。
㈤ 如何查找有關「人工智慧」方面的文獻寫出詳細的檢索策略
有很多網站是專門「賣」這些文獻的,我記得有萬方數據什麼,那個可以搜索文獻,但是都是要付費的,不知道你是不是大學生,一般學校會為學生老師提供搜索,並且是免費的,就是學校買的
㈥ 智能搜索是什麼
智能搜索引擎 智能搜索引擎是結合了人工智慧技術的新一代搜索引擎。他除了能提供傳統的快速檢索、相關度排序等功能,還能提供用戶角色登記、用戶興趣自動識別、內容的語義理解、智能信息化過濾和推送等功能。
智能搜索引擎設計追求的目標是:根據用戶的請求,從可以獲得的網路資源中檢索出對用戶最有價值的信息。
智能搜索引擎具有信息服務的智能化、人性化特徵,允許網民採用自然語言進行信息的檢索,為他們提供更方便、更確切的搜索服務。
㈦ 搜索引擎技術的智能技術
網路機器人(Robot)又被稱作Spider、Worm或Random,核心目的是為獲取Internet上的信息。一般定義為「一個在網路上檢索文件且自動跟蹤該文件的超文本結構並循環檢索被參照的所有文件的軟體」。機器人利用主頁中的超文本鏈接遍歷WWW,通過URL引用從一個HTML文檔爬行到另一個HTML文檔。網上機器人收集到的信息可有多種用途,如建立索引、HIML文件合法性的驗證、URL鏈接點驗證與確認、監控與獲取更新信息、站點鏡像等。
機器人安在網上爬行,因此需要建立一個URL列表來記錄訪問的軌跡。它使用超文本,指向其他文檔的URL是隱藏在文檔中,需要從中分析提取URL,機器人一般都用於生成索引資料庫。所有WWW的搜索程序都有如下的工作步驟:
(1)機器人從起始URL列表中取出URL並從網上讀取其指向的內容;
(2)從每一個文檔中提取某些信息(如關鍵字)並放入索引資料庫中;
(3)從文檔中提取指向其他文檔的URL,並加入到URL列表中;
(4)重復上述3個步驟,直到再沒有新的URL出現或超出了某些限制(時間或磁碟空間);
(5)給索引資料庫加上檢索介面,向網上用戶發布或提供給用戶檢索。
搜索演算法一般有深度優先和廣度優先兩種基本的搜索策略。機器人以URL列表存取的方式決定搜索策略:先進先出,則形成廣度優先搜索,當起始列表包含有大量的WWW伺服器地址時,廣度優先搜索將產生一個很好的初始結果,但很難深入到伺服器中去;先進後出,則形成深度優先搜索,這樣能產生較好的文檔分布,更容易發現文檔的結構,即找到最大數目的交叉引用。也可以採用遍歷搜索的方法,就是直接將32位的IP地址變化,逐個搜索整個Internet。
量販式搜索引擎優化是一個技術含量很高的網路應用系統。它包括網路技術、資料庫技術動標引技術、檢索技術、自動分類技術,機器學習等人工智慧技術。
㈧ 請問:人工智慧與智能檢索有什麼關系
人工智慧是指機械其有人的一定的像人類某方面智慧的能力.
智能檢索是指檢索能根據用戶的輸入的檢索詞而進行相關的,有選擇地進行,是將人工智慧的應用於檢索方面.
㈨ 智能檢索必須解決的問題有哪些
要完成信息檢索的匹配與選擇,需要完成六方面的工作:
一、分析研究課題,明確檢索要求課題的主題內容、研究要點、學科範圍、語種范圍、時間范圍、文獻類型等。
二、選擇信息檢索系統,確定檢索途徑
1、選擇信息檢索系統的方法:
(1)在信息檢索系統齊全的情況下,首先使用信息檢索工具指南來指導選擇;
(2)在沒有信息檢索工具指南的情況下,可以採用瀏覽圖書館、信息所的信息檢索工具室所陳列的信息檢索工具的方式進行選擇;
(3)從所熟悉的信息檢索工具中選擇;
(4)主動向工作人員請教;
(5)通過網路在線幫助選擇。
2、選擇信息檢索系統的原則:
(1)收錄的文獻信息需含蓋檢索課題的主題內容;
(2)就近原則,方便查閱;
(3)盡可能質量較高、收錄文獻信息量大、報道及時、索引齊全、使用方便;
(4)記錄來源,文獻類型,文種盡量滿足檢索課題的要求;
(5)資料庫是否有對應的印刷型版本;
(6)根據經濟條件選擇信息檢索系統;
(7)根據對檢索信息熟悉的程度選擇;
(8)選擇查出的信息相關度高的網路搜索引擎。
三、選擇檢索詞確定檢索詞的基本方法:
選擇規范化的檢索詞;使用各學科在國際上通用的、國外文獻中出現過的術語作檢索詞;找出課題涉及的隱性主題概念作檢索詞;選擇課題核心概念作檢索詞;注意檢索詞的縮寫詞、詞形變化以及英美的不同拼法;聯機方式確定檢索詞。
四、制定檢索策略,查閱檢索工具
1、制定檢索策略的前提條件是要了解信息檢索系統的基本性能,基礎是要明確檢索課題的內容要求和檢索目的,關鍵是要正確選擇檢索詞和合理使用邏輯組配。
2、產生誤檢的原因可能有:一詞多義的檢索詞的使用;檢索詞與英美人的姓名、地址名稱、期刊名稱相同;不嚴格的位置算符的運用;檢索式中沒有使用邏輯非運算;截詞運算不恰當;組號前忘記輸入指令「s」;邏輯運算符號前後未空格;括弧使用不正確;從錯誤的組號中列印檢索結果;檢索式中檢索概念太少。
3、產生漏檢的原因或檢索結果為零的原因可能有:沒有使用足夠的同義詞和近義詞或隱含概念;位置算符用得過嚴、過多;邏輯「與」用得太多;後綴代碼限製得太嚴;檢索工具選擇不恰當;截詞運算不恰當;單詞拼寫錯誤、文檔號錯誤、組號錯誤、括弧不匹配等。
4、提高查准率的方法有:使用下位概念檢索;將檢索詞的檢索范圍限在篇名、敘詞和文摘欄位;使用邏輯「與」或邏輯「非」;運用限制選擇功能;進行進階檢或高級檢索。5、提高查全率的方法有:選擇全欄位中檢索;減少對文獻外表特徵的限定;使用邏輯「或」;利用截詞檢索;使用檢索詞的上位概念進行檢索;把(W)算符改成(1N),(2N);進入更合適的資料庫查找。
五、處理檢索結果將所獲得的檢索結果加以系統整理,篩選出符合課題要求的相關文獻信息,選擇檢索結果的著錄格式,辨認文獻類型、文種、著者、篇名、內容、出處等項記錄內容,輸出檢索結果。
六、原始文獻的獲取
1、利用二次文獻檢索工具獲取原始文獻。
2、利用館藏目錄和聯合目錄獲取原始文獻。
3、利用文獻出版發行機構獲取原始文獻。
。4、利用文獻著者獲取原始文獻。
5、利用網路獲取原始文獻參考。