搜索引擎如何搜索到信息

隨著互聯網的迅猛發展、WEB信息的增加,用戶要在信息海洋里查找自己所需的信息,就象大海撈針一樣,搜索引擎技術恰好解決了這一難題(它可以為用戶提供信息檢索服務)。搜索引擎是指互聯網上專門提供檢索服務的一類網站,這些站點的伺服器通過網路搜索軟體(例如網路搜索機器人)或網路登錄等方式,將Intemet上大量網站的頁面信息收集到本地,經過加工處理建立信息資料庫和索引資料庫,從而對用戶提出的各種檢索作出響應,提供用戶所需的信息或相關指針。用戶的檢索途徑主要包括自由詞全文檢索、關鍵詞檢索、分類檢索及其他特殊信息的檢索(如企業、人名、電話黃頁等)。下面以網路搜索機器人為例來說明搜索引擎技術。
1.網路機器人技術
網路機器人(Robot)又被稱作Spider、Worm或Random,核心目的是為獲取Intemet上的信息。一般定義為「一個在網路上檢索文件且自動跟蹤該文件的超文本結構並循環檢索被參照的所有文件的軟體」。機器人利用主頁中的超文本鏈接遍歷WWW,通過U趾引用從一個HT2LIL文檔爬行到另一個HTML文檔。網上機器人收集到的信息可有多種用途,如建立索引、HIML文件合法性的驗證、uRL鏈接點驗證與確認、監控與獲取更新信息、站點鏡像等。
機器人安在網上爬行,因此需要建立一個URL列表來記錄訪問的軌跡。它使用超文本,指向其他文檔的URL是隱藏在文檔中,需要從中分析提取URL,機器人一般都用於生成索引資料庫。所有WWW的搜索程序都有如下的工作步驟:
(1)機器人從起始URL列表中取出URL並從網上讀取其指向的內容;
(2)從每一個文檔中提取某些信息(如關鍵字)並放入索引資料庫中;
(3)從文檔中提取指向其他文檔的URL,並加入到URL列表中;
(4)重復上述3個步驟,直到再沒有新的URL出現或超出了某些限制(時間或磁碟空間);
(5)給索引資料庫加上檢索介面,向網上用戶發布或提供給用戶檢索。
搜索演算法一般有深度優先和廣度優先兩種基本的搜索策略。機器人以URL列表存取的方式決定搜索策略:先進先出,則形成廣度優先搜索,當起始列表包含有大量的WWW伺服器地址時,廣度優先搜索將產生一個很好的初始結果,但很難深入到伺服器中去;先進後出,則形成深度優先搜索,這樣能產生較好的文檔分布,更容易發現文檔的結構,即找到最大數目的交叉引用。也可以採用遍歷搜索的方法,就是直接將32位的IP地址變化,逐個搜索整個Intemet。
搜索引擎是一個技術含量很高的網路應用系統。它包括網路技術、資料庫技術動標引技術、檢索技術、自動分類技術,機器學習等人工智慧技術。
2.索引技術
索引技術是搜索引擎的核心技術之一。搜索引擎要對所收集到的信息進行整理、分類、索引以產生索引庫,而中文搜索引擎的核心是分詞技術。分詞技術是利用一定的規則和詞庫,切分出一個句子中的詞,為自動索引做好准備。目前的索引多採用Non—clustered方法,該技術和語言文字的學問有很大的關系,具體有如下幾點:
(1)存儲語法庫,和詞彙庫配合分出句子中的詞彙;
(2)存儲詞彙庫,要同時存儲詞彙的使用頻率和常見搭配方式;
(3)詞彙寬,應可劃分為不同的專業庫,以便於處理專業文獻;
(4)對無法分詞的句子,把每個字當作詞來處理。
索引器生成從關鍵詞到URL的關系索引表。索引表一般使用某種形式的倒排表(1nversionUst),即由索引項查找相應的URL。索引表也要記錄索引項在文檔中出現的位置,以便檢索器計算索引項之間的相鄰關系或接近關系,並以特定的數據結構存儲在硬碟上。
不同的搜索引擎系統可能採用不盡相同的標引方法。例如Webcrawler利用全文檢索技術,對網頁中每一個單詞進行索引;Lycos只對頁名、標題以及最重要的100個注釋詞等選擇性詞語進行索引;Infoseek則提供概念檢索和片語檢索,支持and、or、near、not等布爾運算。檢索引擎的索引方法大致可分為自動索引、手工索引和用戶登錄三類。
3. 檢索器與結果處理技術
檢索器的主要功能是根據用戶輸入的關鍵詞在索引器形成的倒排表中進行檢索,同時完成頁面與檢索之間的相關度評價,對將要輸出的結果進行排序,並實現某種用戶相關性反饋機制。
通過搜索引擎獲得的檢索結果往往成百上千,為了得到有用的信息,常用的方法是按網頁的重要性或相關性給網頁評級,進行相關性排序。這里的相關度是指搜索關鍵字在文檔中出現的額度。當額度越高時,則認為該文檔的相關程度越高。能見度也是常用的衡量標准之一。一個網頁的能見度是指該網頁入口超級鏈接的數目。能見度方法是基於這樣的觀點:一個網頁被其他網頁引用得越多,則該網頁就越有價值。特別地,一個網頁被越重要的網頁所引用,則該網頁的重要程度也就越高。結果處理技術可歸納為:
(1)按頻次排定次序 通常,如果一個頁麵包含了越多的關鍵詞,其搜索目標的相關性應該越好,這是非常合平常理的解決方案。
(2)按頁面被訪問度排序 在這種方法中,搜索引擎會記錄它所搜索到的頁面被訪問的頻率。人們訪問較多的頁面通常應該包含比較多的信息,或者有其他吸引入的長處。這種解決方案適合一般的搜索用戶,而因為大部分的搜索引擎都不是專業性用戶,所以這種方案也比較適合一般搜索引擎使用。
(3)二次檢索 進一步凈化(比flne)結果,按照一定的條件對搜索結果進行優化,可以再選擇類別、相關詞進行二次搜索等。
由於目前的搜索引擎還不具備智能,除非知道要查找的文檔的標題,否則排列第一的結果未必是「最好」的結果。所以有些文檔盡管相關程度高,但並不一定是用戶最需要的文檔。
搜索引擎技術的行業應用:
搜索引擎的行業應用一般指類似於千瓦通信提供的多種搜索引擎行業與產品應用模式,大體上分為如下幾種形式:
1、 政府機關行業應用
n 實時跟蹤、採集與業務工作相關的信息來源。
n 全面滿足內部工作人員對互聯網信息的全局觀測需求。
n 及時解決政務外網、政務內網的信息源問題,實現動態發布。
n 快速解決政府主網站對各地級子網站的信息獲取需求。
n 全面整合信息,實現政府內部跨地區、跨部門的信息資源共享與有效溝通。
n 節約信息採集的人力、物力、時間,提高辦公效率。
2、企業行業應用
n 實時准確地監控、追蹤競爭對手動態,是企業獲取競爭情報的利器。
n 及時獲取競爭對手的公開信息以便研究同行業的發展與市場需求。
n 為企業決策部門和管理層提供便捷、多途徑的企業戰略決策工具。
n 大幅度地提高企業獲取、利用情報的效率,節省情報信息收集、存儲、挖掘的相關費用,是提高企業核心競爭力的關鍵。
n 提高企業整體分析研究能力、市場快速反應能力,建立起以知識管理為核心的競爭情報數據倉庫,是提高企業核心競爭力的神經中樞。
3、新聞媒體行業應用
n 快速准確地自動跟蹤、採集數千家網路媒體信息,擴大新聞線索,提高採集速度。
n 支持每天對數萬條新聞進行有效抓取。監控范圍的深度、廣度可以自行設定。
n 支持對所需內容智能提取、審核。
n 實現互聯網信息內容採集、瀏覽、編輯、管理、發布的一體化。
4、 行業網站應用
n 實時跟蹤、採集與網站相關的信息來源。
n 及時跟蹤行業的信息來源網站,自動,快速更新網站信息。動態更新信息。
n 實現互聯網信息內容採集、瀏覽、編輯、管理、發布的一體化。
n 針對商務網站提出商務管理模式,大大提高行業網站的商務應用需求。
n 針對資訊網站分類目錄生成,提出用戶生成網站分類結構。並可以實時增加與更新分類結構。不受級數限制。從而大大利高行業的應用性。
n 提供搜索引擎SEO優化專業服務,快速提高行業網站的推廣
n 提供與CCDC呼叫搜索引擎的廣告合作。建立行業網站聯盟,提高行業網站知名度。
5) 網路信息監察與監控
n 網路輿情系統。如「千瓦通信-網路輿情雷達監測系統」
n 網站信息與內容監察與監控系統,如「千瓦通信-網站信息與內容監測與監察系統(站內神探)」
隨著網際網路的迅猛發展、WEB信息的增加,用戶要在信息海洋里查找信息,就象大海撈
針一樣,搜索引擎技術恰好解決了這一難題(它可以為用戶提供信息檢索服務)。目前,
搜索引擎技術正成為計算機工業界和學術界爭相研究、開發的對象。
搜索引擎(Search Engine)是隨著WEB信息的迅速增加,從1995年開始逐漸發展起來
的技術。據發表在《科學》雜志1999年7月的文章《WEB信息的可訪問性》估計,全球目前
的網頁超過8億,有效數據超過9T,並且仍以每4個月翻一番的速度增長。用戶要在如此浩
瀚的信息海洋里尋找信息,必然會"大海撈針"無功而返。搜索引擎正是為了解決這個"迷航
"問題而出現的技術。搜索引擎以一定的策略在互聯網中搜集、發現信息,對信息進行理解
、提取、組織和處理,並為用戶提供檢索服務,從而起到信息導航的目的。搜索引擎提供
的導航服務已經成為互聯網上非常重要的網路服務,搜索引擎站點也被美譽為"網路門戶"
。搜索引擎技術因而成為計算機工業界和學術界爭相研究、開發的對象。本文旨在對搜索
引擎的關鍵技術進行簡單的介紹,以起到拋磚引玉的作用。

分 類

按照信息搜集方法和服務提供方式的不同,搜索引擎系統可以分為三大類:
1.目錄式搜索引擎:以人工方式或半自動方式搜集信息,由編輯員查看信息之後,人
工形成信息摘要,並將信息置於事先確定的分類框架中。信息大多面向網站,提供目錄瀏
覽服務和直接檢索服務。該類搜索引擎因為加入了人的智能,所以信息准確、導航質量高
,缺點是需要人工介入、維護量大、信息量少、信息更新不及時。這類搜索引擎的代表是
:Yahoo、LookSmart、Open Directory、Go Guide等。
2.機器人搜索引擎:由一個稱為蜘蛛(Spider)的機器人程序以某種策略自動地在互
聯網中搜集和發現信息,由索引器為搜集到的信息建立索引,由檢索器根據用戶的查詢輸
入檢索索引庫,並將查詢結果返回給用戶。服務方式是面向網頁的全文檢索服務。該類搜
索引擎的優點是信息量大、更新及時、毋需人工干預,缺點是返回信息過多,有很多無關
信息,用戶必須從結果中進行篩選。這類搜索引擎的代表是:AltaVista、Northern Ligh
t、Excite、Infoseek、Inktomi、FAST、Lycos、Google;國內代表為:"天網"、悠遊、O
penFind等。
3.元搜索引擎:這類搜索引擎沒有自己的數據,而是將用戶的查詢請求同時向多個搜
索引擎遞交,將返回的結果進行重復排除、重新排序等處理後,作為自己的結果返回給用
戶。服務方式為面向網頁的全文檢索。這類搜索引擎的優點是返回結果的信息量更大、更
全,缺點是不能夠充分使用所使用搜索引擎的功能,用戶需要做更多的篩選。這類搜索引
擎的代表是WebCrawler、InfoMarket等。

性 能 指 標
我們可以將WEB信息的搜索看作一個信息檢索問題,即在由WEB網頁組成的文檔庫中檢索
出與用戶查詢相關的文檔。所以我們可以用衡量傳統信息檢索系統的性能參數-召回率(R
ecall)和精度(Pricision)衡量一個搜索引擎的性能。
召回率是檢索出的相關文檔數和文檔庫中所有的相關文檔數的比率,衡量的是檢索系
統(搜索引擎)的查全率;精度是檢索出的相關文檔數與檢索出的文檔總數的比率,衡量
的是檢索系統(搜索引擎)的查准率。對於一個檢索系統來講,召回率和精度不可能兩全
其美:召回率高時,精度低,精度高時,召回率低。所以常常用11種召回率下11種精度的
平均值(即11點平均精度)來衡量一個檢索系統的精度。對於搜索引擎系統來講,因為沒
有一個搜索引擎系統能夠搜集到所有的WEB網頁,所以召回率很難計算。目前的搜索引擎系
統都非常關心精度。
影響一個搜索引擎系統的性能有很多因素,最主要的是信息檢索模型,包括文檔和查詢
的表示方法、評價文檔和用戶查詢相關性的匹配策略、查詢結果的排序方法和用戶進行相
關度反饋的機制。

主 要 技 術
一個搜索引擎由搜索器、索引器、檢索器和用戶介面等四個部分組成。
1.搜索器
搜索器的功能是在互聯網中漫遊,發現和搜集信息。它常常是一個計算機程序,日夜
不停地運行。它要盡可能多、盡可能快地搜集各種類型的新信息,同時因為互聯網上的信
息更新很快,所以還要定期更新已經搜集過的舊信息,以避免死連接和無效連接。目前有
兩種搜集信息的策略:
● 從一個起始URL集合開始,順著這些URL中的超鏈(Hyperlink),以寬度優先、深
度優先或啟發式方式循環地在互聯網中發現信息。這些起始URL可以是任意的URL,但常常
是一些非常流行、包含很多鏈接的站點(如Yahoo!)。
● 將Web空間按照域名、IP地址或國家域名劃分,每個搜索器負責一個子空間的窮盡
搜索。 搜索器搜集的信息類型多種多樣,包括HTML、XML、Newsgroup文章、FTP文件、
字處理文檔、多媒體信息。 搜索器的實現常常用分布式、並行計算技術,以提高信息
發現和更新的速度。商業搜索引擎的信息發現可以達到每天幾百萬網頁。
2.索引器
索引器的功能是理解搜索器所搜索的信息,從中抽取出索引項,用於表示文檔以及生
成文檔庫的索引表。
索引項有客觀索引項和內容索引項兩種:客觀項與文檔的語意內容無關,如作者名、
URL、更新時間、編碼、長度、鏈接流行度(Link Popularity)等等;內容索引項是用來
反映文檔內容的,如關鍵詞及其權重、短語、單字等等。內容索引項可以分為單索引項和
多索引項(或稱短語索引項)兩種。單索引項對於英文來講是英語單詞,比較容易提取,
因為單詞之間有天然的分隔符(空格);對於中文等連續書寫的語言,必須進行詞語的切
分。 在搜索引擎中,一般要給單索引項賦與一個權值,以表示該索引項對文檔的區分
度,同時用來計算查詢結果的相關度。使用的方法一般有統計法、資訊理論法和概率法。短
語索引項的提取方法有統計法、概率法和語言學法。
索引表一般使用某種形式的倒排表(Inversion List),即由索引項查找相應的文檔
。索引表也可能要記錄索引項在文檔中出現的位置,以便檢索器計算索引項之間的相鄰或
接近關系(proximity)。
索引器可以使用集中式索引演算法或分布式索引演算法。當數據量很大時,必須實現即時
索引(Instant Indexing),否則不能夠跟上信息量急劇增加的速度。索引演算法對索引器
的性能(如大規模峰值查詢時的響應速度)有很大的影響。一個搜索引擎的有效性在很大
程度上取決於索引的質量。
3.檢索器 檢索器的功能是根據用戶的查詢在索引庫中快速檢出文檔,進行文檔與
查詢的相關度評價,對將要輸出的結果進行排序,並實現某種用戶相關性反饋機制。
檢索器常用的信息檢索模型有集合理論模型、代數模型、概率模型和混合模型四種。
4.用戶介面
用戶介面的作用是輸入用戶查詢、顯示查詢結果、提供用戶相關性反饋機制。主要的
目的是方便用戶使用搜索引擎,高效率、多方式地從搜索引擎中得到有效、及時的信息。
用戶介面的設計和實現使用人機交互的理論和方法,以充分適應人類的思維習慣。
用戶輸入介面可以分為簡單介面和復雜介面兩種。
簡單介面只提供用戶輸入查詢串的文本框;復雜介面可以讓用戶對查詢進行限制,如
邏輯運算(與、或、非;+、-)、相近關系(相鄰、NEAR)、域名范圍(如.e、.com)
、出現位置(如標題、內容)、信息時間、長度等等。目前一些公司和機構正在考慮制定
查詢選項的標准。

未 來 動 向
搜索引擎已成為一個新的研究、開發領域。因為它要用到信息檢索、人工智慧、計算
機網路、分布式處理、資料庫、數據挖掘、數字圖書館、自然語言處理等多領域的理論和
技術,所以具有綜合性和挑戰性。又由於搜索引擎有大量的用戶,有很好的經濟價值,所
以引起了世界各國計算機科學界和信息產業界的高度關注,目前的研究、開發十分活躍,
並出現了很多值得注意的動向。
1.十分注意提高信息查詢結果的精度,提高檢索的有效性 用戶在搜索引擎上進行
信息查詢時,並不十分關注返回結果的多少,而是看結果是否和自己的需求吻合。對於一
個查詢,傳統的搜索引擎動輒返回幾十萬、幾百萬篇文檔,用戶不得不在結果中篩選。解
決查詢結果過多的現象目前出現了幾種方法:一是通過各種方法獲得用戶沒有在查詢語句
中表達出來的真正用途,包括使用智能代理跟蹤用戶檢索行為,分析用戶模型;使用相關
度反饋機制,使用戶告訴搜索引擎哪些文檔和自己的需求相關(及其相關的程度),哪些
不相關,通過多次交互逐步求精。二是用正文分類(Text Categorization)技術將結果分
類,使用可視化技術顯示分類結構,用戶可以只瀏覽自己感興趣的類別。三是進行站點類
聚或內容類聚,減少信息的總量。
2.基於智能代理的信息過濾和個性化服務
信息智能代理是另外一種利用互聯網信息的機制。它使用自動獲得的領域模型(如We
b知識、信息處理、與用戶興趣相關的信息資源、領域組織結構)、用戶模型(如用戶背景
、興趣、行為、風格)知識進行信息搜集、索引、過濾(包括興趣過濾和不良信息過濾)
,並自動地將用戶感興趣的、對用戶有用的信息提交給用戶。智能代理具有不斷學習、適
應信息和用戶興趣動態變化的能力,從而提供個性化的服務。智能代理可以在用戶端進行
,也可以在伺服器端運行。
3.採用分布式體系結構提高系統規模和性能
搜索引擎的實現可以採用集中式體系結構和分布式體系結構,兩種方法各有千秋。但
當系統規模到達一定程度(如網頁數達到億級)時,必然要採用某種分布式方法,以提高
系統性能。搜索引擎的各個組成部分,除了用戶介面之外,都可以進行分布:搜索器可以
在多台機器上相互合作、相互分工進行信息發現,以提高信息發現和更新速度;索引器可
以將索引分布在不同的機器上,以減小索引對機器的要求;檢索器可以在不同的機器上.

Ⅱ 搜索引擎是什麼

搜索引擎是指根據一定的策略、運用特定的計算機程序從互聯網上採集信息,在對信息進行組織和處理後,為用戶提供檢索服務,將檢索的相關信息展示給用戶的系統。

搜索引擎是工作於互聯網上的一門檢索技術,它旨在提高人們獲取搜集信息的速度,為人們提供更好的網路使用環境。從功能和原理上搜索引擎大致被分為全文搜索引擎、元搜索引擎、垂直搜索引擎和目錄搜索引擎等四大類。

搜索引擎依託於多種技術,如網路爬蟲技術、檢索排序技術、網頁處理技術、大數據處理技術、自然語言處理技術等,為信息檢索用戶提供快速、高相關性的信息服務。

搜索引擎技術的核心模塊一般包括爬蟲、索引、檢索和排序等,同時可添加其他一系列輔助模塊,以為用戶創造更好的網路使用環境。

搜索引擎發展到今天,基礎架構和演算法在技術上都已經基本成型和成熟。搜索引擎已經發展成為根據一定的策略、運用特定的計算機程序從互聯網上搜集信息,在對信息進行組織和處理後,為用戶提供檢索服務,將用戶檢索相關的信息展示給用戶的系統。

Ⅲ 手機的交互方式有哪些

移動互聯網是未來的發展趨勢,隨著移動設備硬體性能的提升和移動系統的更新,交互設計也被逐漸重視,不再是簡單的將內容從互聯網平台照搬至移動平台,而是解決產品在界面、使用情景、操作流程等方面的用戶體驗。手機作為移動互聯網最主要的載體,從用戶需求觸發,在內容呈現、信息架構、交互操作等方面挖掘設計的可能性,是手機交互設計未來需要重點關注的設計趨勢。一、手勢

有一個詞叫「指手劃腳」,手勢是人類溝通交流不可分割的一部分。對機器能不能用手勢來溝通呢?現在有「智能手勢識別」技術,開辟了我們與電腦、平板、手機間新的溝通方式。這主要是通過攝像頭跟蹤進行手勢識別,從而控制設備的操作,是一種很智能的人機交互方式。市場研究機構ABIResearch公布的一項最新研究預測,到2017年,具有視覺手勢識別功能的智能手機出貨量將達6億部。

隔空玩「切水果」已經可以應用。我們還可以將其應用在傳送文件上,先在一台設備上選擇想要傳輸的文件,抓上拖拽到另一台設備上,即可完成傳輸;或者是在餐館點餐,食客隔空一點,就選中想要的菜;或者還可控制那些沒有顯示屏的設備,揮揮手,空調開了,電燈亮了。

二、語音

語音是現在應用比較多的交互方式。現在發簡訊、打電話、設鬧鍾、記筆記,很多人都開始「動口」來做。除了像蘋果的Siri這種廠商自帶的應用外,還有類似「靈犀」這樣可以用在各種不同手機上的應用 ,而且十分智能。我們家的小朋友,曾經企圖用「語音」來做作業,問出了「怎麼組詞」的問題,「靈犀」的回答是「自己的事情自己做」!:)

不管怎麼樣,語音識別開啟了人機交互新的方式。個人十分看好搜索領域用上語音交互技術。而因為要和遠端伺服器對話,通常這類應用對網路的依賴很強。

三、默讀

出聲操作手機不稀奇,將來不出聲,終端都能知道你要干什麼。這用的是「默讀識別」。不需要發出聲音,系統就可以將喉部聲帶動作發出的電信號轉換成語音,從而破譯人想說的話。工作原理是當一個人默念或者低語時,不論有沒有實際的唇部和臉部動作,都會產生相應的生物學信號。只要在人體下巴和喉結兩側固定鈕扣大小的特殊感測器,就可以捕獲大腦向發聲器官發出的指令,並將這些信號「閱讀」出來。目前美國宇航局艾姆斯研究中心正在開發,根據該項目首席科學家恰克•喬金森表示,幾年之後,無聲語音識別技術就能夠進入商業應用。

可應用的場景包括雜鬧環境,或是水下、太空等不方便說話的地方;還能幫助有語言障礙的人士同外界交流。將來也有可能嘗試利用無聲語音識別系統來控制各種外設終端(比如隔空取物?)。

四、眼動

已發布的三星GALAXY S4即以「眼球追蹤」為賣點。利用這項技術,可以實現在三星自有瀏覽器上自動翻頁。其基本工作原理是利用圖像處理技術,使用攝像頭連續地記錄視線變化,追蹤視覺注視頻率以及注視持續時間長短,從而分析判斷出用戶的行為並反應。

這將會很受商家歡迎,因為能記錄用戶視線目光的轉移,從而知道用戶對什麼東西感興趣。這項技術也有助於行動不方便的人與世界溝通。或者將來用戶將目光聚集在屏幕的特定區域,就能發送郵件,打出電話。當然還有可穿戴式設備,也可以藉助眼動跟蹤技術,更加方便地完成輸入操作。

五、指紋

蘋果在發布iPhone 5s的時候,除了64位的A7,更是把指紋識別當做5s空前、超前的賣點。除了類似解鎖加密保護等信息安全的功用外,指紋識別更是一種全新的交互方式。

比如支付領域,轉賬匯款、余額查詢、付款交易,指紋一刷就成。鑒於我們有十個手指,或者我們可用一個手指指紋做登錄密碼,再找一個手指作為支付密碼?如果將我們的十個手指頭配備上不同的指令,與手機交互,操作就更為簡便了:食指打電話,中指發簡訊,小指打開郵件界面,再來個手指開關數據網路…

javascript搜索功能是怎麼實現的要跟後台交互吧是不是和過濾功能差不多原理

搜索功能有多種實現方式 ,前後端都可以實現
第一種:
頁面內搜索(類似CTRL+F),這個可以純前端完成,直接用js匹配搜索結果,進行隱藏顯示或改變顏色等
第二種:
純後端方案,將搜索的字元串拼接到一個新的url參數後,然後跳轉到生成的url上,直接顯示新頁面搜索結果,如最早的搜索就是一個跳轉 ,目前已經不使用這種方式
第三種:
Ajax搜索,需要前後端配合,將關鍵字發送一個請求到後端,後端需要將結果的數據傳給前端,前端根據返回的數據,重新對頁面部分進行渲染
CTRL+F不支持正則,這個是瀏覽器自帶的功能,由於正則對於普通用戶來說,是很專業的,瀏覽器一般不會去支持很少有人會用的功能,當然是否支持取決於瀏覽器廠商的想法

Ⅳ 怎樣做一個集成搜索引擎的搜索框

一個搜索引擎由搜索器、索引器、檢索器和用戶介面等四個部分組成。
1.搜索器
搜索器的功能是在互聯網中漫遊,發現和搜集信息。它常常是一個計算機程序,日夜不停地運行。它要盡可能多、盡可能快地搜集各種類型的新信息,同時因為互聯網上的信息更新很快,所以還要定期更新已經搜集過的舊信息,以避免死連接和無效連接。目前有兩種搜集信息的策略:
● 從一個起始URL集合開始,順著這些URL中的超鏈(Hyperlink),以寬度優先、深度優先或啟發式方式循環地在互聯網中發現信息。這些起始URL可以是任意的URL,但常常是一些非常流行、包含很多鏈接的站點(如Yahoo!)。
● 將Web空間按照域名、IP地址或國家域名劃分,每個搜索器負責一個子空間的窮盡搜索。
搜索器搜集的信息類型多種多樣,包括HTML、XML、Newsgroup文章、FTP文件、字處理文檔、多媒體信息。
搜索器的實現常常用分布式、並行計算技術,以提高信息發現和更新的速度。商業搜索引擎的信息發現可以達到每天幾百萬網頁。
2.索引器
索引器的功能是理解搜索器所搜索的信息,從中抽取出索引項,用於表示文檔以及生成文檔庫的索引表。
索引項有客觀索引項和內容索引項兩種:客觀項與文檔的語意內容無關,如作者名、URL、更新時間、編碼、長度、鏈接流行度(Link Popularity)等等;內容索引項是用來反映文檔內容的,如關鍵詞及其權重、短語、單字等等。內容索引項可以分為單索引項和多索引項(或稱短語索引項)兩種。單索引項對於英文來講是英語單詞,比較容易提取,因為單詞之間有天然的分隔符(空格);對於中文等連續書寫的語言,必須進行詞語的切分。
在搜索引擎中,一般要給單索引項賦與一個權值,以表示該索引項對文檔的區分度,同時用來計算查詢結果的相關度。使用的方法一般有統計法、資訊理論法和概率法。短語索引項的提取方法有統計法、概率法和語言學法。
索引表一般使用某種形式的倒排表(Inversion List),即由索引項查找相應的文檔。索引表也可能要記錄索引項在文檔中出現的位置,以便檢索器計算索引項之間的相鄰或接近關系(proximity)。
索引器可以使用集中式索引演算法或分布式索引演算法。當數據量很大時,必須實現即時索引(Instant Indexing),否則不能夠跟上信息量急劇增加的速度。索引演算法對索引器的性能(如大規模峰值查詢時的響應速度)有很大的影響。一個搜索引擎的有效性在很大程度上取決於索引的質量。
3.檢索器
檢索器的功能是根據用戶的查詢在索引庫中快速檢出文檔,進行文檔與查詢的相關度評價,對將要輸出的結果進行排序,並實現某種用戶相關性反饋機制。
檢索器常用的信息檢索模型有集合理論模型、代數模型、概率模型和混合模型四種。
4.用戶介面
用戶介面的作用是輸入用戶查詢、顯示查詢結果、提供用戶相關性反饋機制。主要的目的是方便用戶使用搜索引擎,高效率、多方式地從搜索引擎中得到有效、及時的信息。用戶介面的設計和實現使用人機交互的理論和方法,以充分適應人類的思維習慣。 用戶輸入介面可以分為簡單介面和復雜介面兩種。

Ⅵ 搜索引擎如何實現搜索的啊

隨著互聯網的迅猛發展、WEB信息的增加,用戶要在信息海洋里查找自己所需的信息,就象大海撈針一樣,搜索引擎技術恰好解決了這一難題(它可以為用戶提供信息檢索服務)。搜索引擎是指互聯網上專門提供檢索服務的一類網站,這些站點的伺服器通過網路搜索軟體(例如網路搜索機器人)或網路登錄等方式,將Intemet上大量網站的頁面信息收集到本地,經過加工處理建立信息資料庫和索引資料庫,從而對用戶提出的各種檢索作出響應,提供用戶所需的信息或相關指針。用戶的檢索途徑主要包括自由詞全文檢索、關鍵詞檢索、分類檢索及其他特殊信息的檢索(如企業、人名、電話黃頁等)。下面以網路搜索機器人為例來說明搜索引擎技術。
1.網路機器人技術
網路機器人(Robot)又被稱作Spider、Worm或Random,核心目的是為獲取Intemet上的信息。一般定義為「一個在網路上檢索文件且自動跟蹤該文件的超文本結構並循環檢索被參照的所有文件的軟體」。機器人利用主頁中的超文本鏈接遍歷WWW,通過U趾引用從一個HT2LIL文檔爬行到另一個HTML文檔。網上機器人收集到的信息可有多種用途,如建立索引、HIML文件合法性的驗證、uRL鏈接點驗證與確認、監控與獲取更新信息、站點鏡像等。
機器人安在網上爬行,因此需要建立一個URL列表來記錄訪問的軌跡。它使用超文本,指向其他文檔的URL是隱藏在文檔中,需要從中分析提取URL,機器人一般都用於生成索引資料庫。所有WWW的搜索程序都有如下的工作步驟:
(1)機器人從起始URL列表中取出URL並從網上讀取其指向的內容;
(2)從每一個文檔中提取某些信息(如關鍵字)並放入索引資料庫中;
(3)從文檔中提取指向其他文檔的URL,並加入到URL列表中;
(4)重復上述3個步驟,直到再沒有新的URL出現或超出了某些限制(時間或磁碟空間);
(5)給索引資料庫加上檢索介面,向網上用戶發布或提供給用戶檢索。
搜索演算法一般有深度優先和廣度優先兩種基本的搜索策略。機器人以URL列表存取的方式決定搜索策略:先進先出,則形成廣度優先搜索,當起始列表包含有大量的WWW伺服器地址時,廣度優先搜索將產生一個很好的初始結果,但很難深入到伺服器中去;先進後出,則形成深度優先搜索,這樣能產生較好的文檔分布,更容易發現文檔的結構,即找到最大數目的交叉引用。也可以採用遍歷搜索的方法,就是直接將32位的IP地址變化,逐個搜索整個Intemet。
搜索引擎是一個技術含量很高的網路應用系統。它包括網路技術、資料庫技術動標引技術、檢索技術、自動分類技術,機器學習等人工智慧技術。
2.索引技術
索引技術是搜索引擎的核心技術之一。搜索引擎要對所收集到的信息進行整理、分類、索引以產生索引庫,而中文搜索引擎的核心是分詞技術。分詞技術是利用一定的規則和詞庫,切分出一個句子中的詞,為自動索引做好准備。目前的索引多採用Non—clustered方法,該技術和語言文字的學問有很大的關系,具體有如下幾點:
(1)存儲語法庫,和詞彙庫配合分出句子中的詞彙;
(2)存儲詞彙庫,要同時存儲詞彙的使用頻率和常見搭配方式;
(3)詞彙寬,應可劃分為不同的專業庫,以便於處理專業文獻;
(4)對無法分詞的句子,把每個字當作詞來處理。
索引器生成從關鍵詞到URL的關系索引表。索引表一般使用某種形式的倒排表(1nversionUst),即由索引項查找相應的URL。索引表也要記錄索引項在文檔中出現的位置,以便檢索器計算索引項之間的相鄰關系或接近關系,並以特定的數據結構存儲在硬碟上。
不同的搜索引擎系統可能採用不盡相同的標引方法。例如Webcrawler利用全文檢索技術,對網頁中每一個單詞進行索引;Lycos只對頁名、標題以及最重要的100個注釋詞等選擇性詞語進行索引;Infoseek則提供概念檢索和片語檢索,支持and、or、near、not等布爾運算。檢索引擎的索引方法大致可分為自動索引、手工索引和用戶登錄三類。
3. 檢索器與結果處理技術
檢索器的主要功能是根據用戶輸入的關鍵詞在索引器形成的倒排表中進行檢索,同時完成頁面與檢索之間的相關度評價,對將要輸出的結果進行排序,並實現某種用戶相關性反饋機制。
通過搜索引擎獲得的檢索結果往往成百上千,為了得到有用的信息,常用的方法是按網頁的重要性或相關性給網頁評級,進行相關性排序。這里的相關度是指搜索關鍵字在文檔中出現的額度。當額度越高時,則認為該文檔的相關程度越高。能見度也是常用的衡量標准之一。一個網頁的能見度是指該網頁入口超級鏈接的數目。能見度方法是基於這樣的觀點:一個網頁被其他網頁引用得越多,則該網頁就越有價值。特別地,一個網頁被越重要的網頁所引用,則該網頁的重要程度也就越高。結果處理技術可歸納為:
(1)按頻次排定次序 通常,如果一個頁麵包含了越多的關鍵詞,其搜索目標的相關性應該越好,這是非常合平常理的解決方案。
(2)按頁面被訪問度排序 在這種方法中,搜索引擎會記錄它所搜索到的頁面被訪問的頻率。人們訪問較多的頁面通常應該包含比較多的信息,或者有其他吸引入的長處。這種解決方案適合一般的搜索用戶,而因為大部分的搜索引擎都不是專業性用戶,所以這種方案也比較適合一般搜索引擎使用。
(3)二次檢索 進一步凈化(比flne)結果,按照一定的條件對搜索結果進行優化,可以再選擇類別、相關詞進行二次搜索等。
由於目前的搜索引擎還不具備智能,除非知道要查找的文檔的標題,否則排列第一的結果未必是「最好」的結果。所以有些文檔盡管相關程度高,但並不一定是用戶最需要的文檔。
搜索引擎技術的行業應用:
搜索引擎的行業應用一般指類似於千瓦通信提供的多種搜索引擎行業與產品應用模式,大體上分為如下幾種形式:
1、 政府機關行業應用
n 實時跟蹤、採集與業務工作相關的信息來源。
n 全面滿足內部工作人員對互聯網信息的全局觀測需求。
n 及時解決政務外網、政務內網的信息源問題,實現動態發布。
n 快速解決政府主網站對各地級子網站的信息獲取需求。
n 全面整合信息,實現政府內部跨地區、跨部門的信息資源共享與有效溝通。
n 節約信息採集的人力、物力、時間,提高辦公效率。
2、企業行業應用
n 實時准確地監控、追蹤競爭對手動態,是企業獲取競爭情報的利器。
n 及時獲取競爭對手的公開信息以便研究同行業的發展與市場需求。
n 為企業決策部門和管理層提供便捷、多途徑的企業戰略決策工具。
n 大幅度地提高企業獲取、利用情報的效率,節省情報信息收集、存儲、挖掘的相關費用,是提高企業核心競爭力的關鍵。
n 提高企業整體分析研究能力、市場快速反應能力,建立起以知識管理為核心的競爭情報數據倉庫,是提高企業核心競爭力的神經中樞。
3、新聞媒體行業應用
n 快速准確地自動跟蹤、採集數千家網路媒體信息,擴大新聞線索,提高採集速度。
n 支持每天對數萬條新聞進行有效抓取。監控范圍的深度、廣度可以自行設定。
n 支持對所需內容智能提取、審核。
n 實現互聯網信息內容採集、瀏覽、編輯、管理、發布的一體化。
4、 行業網站應用
n 實時跟蹤、採集與網站相關的信息來源。
n 及時跟蹤行業的信息來源網站,自動,快速更新網站信息。動態更新信息。
n 實現互聯網信息內容採集、瀏覽、編輯、管理、發布的一體化。
n 針對商務網站提出商務管理模式,大大提高行業網站的商務應用需求。
n 針對資訊網站分類目錄生成,提出用戶生成網站分類結構。並可以實時增加與更新分類結構。不受級數限制。從而大大利高行業的應用性。
n 提供搜索引擎SEO優化專業服務,快速提高行業網站的推廣。
n 提供與CCDC呼叫搜索引擎的廣告合作。建立行業網站聯盟,提高行業網站知名度。
5) 網路信息監察與監控
n 網路輿情系統。如「千瓦通信-網路輿情雷達監測系統」
n 網站信息與內容監察與監控系統,如「千瓦通信-網站信息與內容監測與監察系統(站內神探)」
隨著網際網路的迅猛發展、WEB信息的增加,用戶要在信息海洋里查找信息,就象大海撈
針一樣,搜索引擎技術恰好解決了這一難題(它可以為用戶提供信息檢索服務)。目前,
搜索引擎技術正成為計算機工業界和學術界爭相研究、開發的對象。
搜索引擎(Search Engine)是隨著WEB信息的迅速增加,從1995年開始逐漸發展起來
的技術。據發表在《科學》雜志1999年7月的文章《WEB信息的可訪問性》估計,全球目前
的網頁超過8億,有效數據超過9T,並且仍以每4個月翻一番的速度增長。用戶要在如此浩
瀚的信息海洋里尋找信息,必然會"大海撈針"無功而返。搜索引擎正是為了解決這個"迷航
"問題而出現的技術。搜索引擎以一定的策略在互聯網中搜集、發現信息,對信息進行理解
、提取、組織和處理,並為用戶提供檢索服務,從而起到信息導航的目的。搜索引擎提供
的導航服務已經成為互聯網上非常重要的網路服務,搜索引擎站點也被美譽為"網路門戶"
。搜索引擎技術因而成為計算機工業界和學術界爭相研究、開發的對象。本文旨在對搜索
引擎的關鍵技術進行簡單的介紹,以起到拋磚引玉的作用。

分 類

按照信息搜集方法和服務提供方式的不同,搜索引擎系統可以分為三大類:
1.目錄式搜索引擎:以人工方式或半自動方式搜集信息,由編輯員查看信息之後,人
工形成信息摘要,並將信息置於事先確定的分類框架中。信息大多面向網站,提供目錄瀏
覽服務和直接檢索服務。該類搜索引擎因為加入了人的智能,所以信息准確、導航質量高
,缺點是需要人工介入、維護量大、信息量少、信息更新不及時。這類搜索引擎的代表是
:Yahoo、LookSmart、Open Directory、Go Guide等。
2.機器人搜索引擎:由一個稱為蜘蛛(Spider)的機器人程序以某種策略自動地在互
聯網中搜集和發現信息,由索引器為搜集到的信息建立索引,由檢索器根據用戶的查詢輸
入檢索索引庫,並將查詢結果返回給用戶。服務方式是面向網頁的全文檢索服務。該類搜
索引擎的優點是信息量大、更新及時、毋需人工干預,缺點是返回信息過多,有很多無關
信息,用戶必須從結果中進行篩選。這類搜索引擎的代表是:AltaVista、Northern Ligh
t、Excite、Infoseek、Inktomi、FAST、Lycos、Google;國內代表為:"天網"、悠遊、O
penFind等。
3.元搜索引擎:這類搜索引擎沒有自己的數據,而是將用戶的查詢請求同時向多個搜
索引擎遞交,將返回的結果進行重復排除、重新排序等處理後,作為自己的結果返回給用
戶。服務方式為面向網頁的全文檢索。這類搜索引擎的優點是返回結果的信息量更大、更
全,缺點是不能夠充分使用所使用搜索引擎的功能,用戶需要做更多的篩選。這類搜索引
擎的代表是WebCrawler、InfoMarket等。

性 能 指 標
我們可以將WEB信息的搜索看作一個信息檢索問題,即在由WEB網頁組成的文檔庫中檢索
出與用戶查詢相關的文檔。所以我們可以用衡量傳統信息檢索系統的性能參數-召回率(R
ecall)和精度(Pricision)衡量一個搜索引擎的性能。
召回率是檢索出的相關文檔數和文檔庫中所有的相關文檔數的比率,衡量的是檢索系
統(搜索引擎)的查全率;精度是檢索出的相關文檔數與檢索出的文檔總數的比率,衡量
的是檢索系統(搜索引擎)的查准率。對於一個檢索系統來講,召回率和精度不可能兩全
其美:召回率高時,精度低,精度高時,召回率低。所以常常用11種召回率下11種精度的
平均值(即11點平均精度)來衡量一個檢索系統的精度。對於搜索引擎系統來講,因為沒
有一個搜索引擎系統能夠搜集到所有的WEB網頁,所以召回率很難計算。目前的搜索引擎系
統都非常關心精度。
影響一個搜索引擎系統的性能有很多因素,最主要的是信息檢索模型,包括文檔和查詢
的表示方法、評價文檔和用戶查詢相關性的匹配策略、查詢結果的排序方法和用戶進行相
關度反饋的機制。

主 要 技 術
一個搜索引擎由搜索器、索引器、檢索器和用戶介面等四個部分組成。
1.搜索器
搜索器的功能是在互聯網中漫遊,發現和搜集信息。它常常是一個計算機程序,日夜
不停地運行。它要盡可能多、盡可能快地搜集各種類型的新信息,同時因為互聯網上的信
息更新很快,所以還要定期更新已經搜集過的舊信息,以避免死連接和無效連接。目前有
兩種搜集信息的策略:
● 從一個起始URL集合開始,順著這些URL中的超鏈(Hyperlink),以寬度優先、深
度優先或啟發式方式循環地在互聯網中發現信息。這些起始URL可以是任意的URL,但常常
是一些非常流行、包含很多鏈接的站點(如Yahoo!)。
● 將Web空間按照域名、IP地址或國家域名劃分,每個搜索器負責一個子空間的窮盡
搜索。 搜索器搜集的信息類型多種多樣,包括HTML、XML、Newsgroup文章、FTP文件、
字處理文檔、多媒體信息。 搜索器的實現常常用分布式、並行計算技術,以提高信息
發現和更新的速度。商業搜索引擎的信息發現可以達到每天幾百萬網頁。
2.索引器
索引器的功能是理解搜索器所搜索的信息,從中抽取出索引項,用於表示文檔以及生
成文檔庫的索引表。
索引項有客觀索引項和內容索引項兩種:客觀項與文檔的語意內容無關,如作者名、
URL、更新時間、編碼、長度、鏈接流行度(Link Popularity)等等;內容索引項是用來
反映文檔內容的,如關鍵詞及其權重、短語、單字等等。內容索引項可以分為單索引項和
多索引項(或稱短語索引項)兩種。單索引項對於英文來講是英語單詞,比較容易提取,
因為單詞之間有天然的分隔符(空格);對於中文等連續書寫的語言,必須進行詞語的切
分。 在搜索引擎中,一般要給單索引項賦與一個權值,以表示該索引項對文檔的區分
度,同時用來計算查詢結果的相關度。使用的方法一般有統計法、資訊理論法和概率法。短
語索引項的提取方法有統計法、概率法和語言學法。
索引表一般使用某種形式的倒排表(Inversion List),即由索引項查找相應的文檔
。索引表也可能要記錄索引項在文檔中出現的位置,以便檢索器計算索引項之間的相鄰或
接近關系(proximity)。
索引器可以使用集中式索引演算法或分布式索引演算法。當數據量很大時,必須實現即時
索引(Instant Indexing),否則不能夠跟上信息量急劇增加的速度。索引演算法對索引器
的性能(如大規模峰值查詢時的響應速度)有很大的影響。一個搜索引擎的有效性在很大
程度上取決於索引的質量。
3.檢索器 檢索器的功能是根據用戶的查詢在索引庫中快速檢出文檔,進行文檔與
查詢的相關度評價,對將要輸出的結果進行排序,並實現某種用戶相關性反饋機制。
檢索器常用的信息檢索模型有集合理論模型、代數模型、概率模型和混合模型四種。
4.用戶介面
用戶介面的作用是輸入用戶查詢、顯示查詢結果、提供用戶相關性反饋機制。主要的
目的是方便用戶使用搜索引擎,高效率、多方式地從搜索引擎中得到有效、及時的信息。
用戶介面的設計和實現使用人機交互的理論和方法,以充分適應人類的思維習慣。
用戶輸入介面可以分為簡單介面和復雜介面兩種。
簡單介面只提供用戶輸入查詢串的文本框;復雜介面可以讓用戶對查詢進行限制,如
邏輯運算(與、或、非;+、-)、相近關系(相鄰、NEAR)、域名范圍(如.e、.com)
、出現位置(如標題、內容)、信息時間、長度等等。目前一些公司和機構正在考慮制定
查詢選項的標准。

未 來 動 向
搜索引擎已成為一個新的研究、開發領域。因為它要用到信息檢索、人工智慧、計算
機網路、分布式處理、資料庫、數據挖掘、數字圖書館、自然語言處理等多領域的理論和
技術,所以具有綜合性和挑戰性。又由於搜索引擎有大量的用戶,有很好的經濟價值,所
以引起了世界各國計算機科學界和信息產業界的高度關注,目前的研究、開發十分活躍,
並出現了很多值得注意的動向。
1.十分注意提高信息查詢結果的精度,提高檢索的有效性 用戶在搜索引擎上進行
信息查詢時,並不十分關注返回結果的多少,而是看結果是否和自己的需求吻合。對於一
個查詢,傳統的搜索引擎動輒返回幾十萬、幾百萬篇文檔,用戶不得不在結果中篩選。解
決查詢結果過多的現象目前出現了幾種方法:一是通過各種方法獲得用戶沒有在查詢語句
中表達出來的真正用途,包括使用智能代理跟蹤用戶檢索行為,分析用戶模型;使用相關
度反饋機制,使用戶告訴搜索引擎哪些文檔和自己的需求相關(及其相關的程度),哪些
不相關,通過多次交互逐步求精。二是用正文分類(Text Categorization)技術將結果分
類,使用可視化技術顯示分類結構,用戶可以只瀏覽自己感興趣的類別。三是進行站點類
聚或內容類聚,減少信息的總量。
2.基於智能代理的信息過濾和個性化服務
信息智能代理是另外一種利用互聯網信息的機制。它使用自動獲得的領域模型(如We
b知識、信息處理、與用戶興趣相關的信息資源、領域組織結構)、用戶模型(如用戶背景
、興趣、行為、風格)知識進行信息搜集、索引、過濾(包括興趣過濾和不良信息過濾)
,並自動地將用戶感興趣的、對用戶有用的信息提交給用戶。智能代理具有不斷學習、適
應信息和用戶興趣動態變化的能力,從而提供個性化的服務。智能代理可以在用戶端進行
,也可以在伺服器端運行。
3.採用分布式體系結構提高系統規模和性能
搜索引擎的實現可以採用集中式體系結構和分布式體系結構,兩種方法各有千秋。但
當系統規模到達一定程度(如網頁數達到億級)時,必然要採用某種分布式方法,以提高
系統性能。搜索引擎的各個組成部分,除了用戶介面之外,都可以進行分布:搜索器可以
在多台機器上相互合作、相互分工進行信息發現,以提高信息發現和更新速度;索引器可
以將索引分布在不同的機器上,以減小索引對機器的要求;檢索器可以在不同的機器上.

Ⅶ 如何使你的網站擁有受歡迎的交互界面

交互設計如今已是一個十分常見的問題,但許多設計者和開發者仍不知道它的具體意義。今天,我們將從不同於以往的方面:我們將會深入講解能使你的網站擁有良好交互性的用戶界面和設計原則。 首先,何為IxD 交互設計(即IxD)是一塊發展迅速的新領域,大致出現於10-15年之前,源於一些體現設計問題的研究,後來被專業設計者鑒別和接受。 交互設計促進人與環境的交流,這里我們指的是人和網站的交流,交互設計師只要考慮用戶和電腦的交互,毋須像UX設計者那樣思考軟體或系統所有涉及用戶的方面。你也許在不同大學里聽說過人機交互度——這些度基本是在IxD領域中培養的。 這樣的設計師要做什麼? 一個交互設計師會思考誰是產品的目標用戶以及誰會使用它。用戶研究者或是信息架構師會提供這些信息。在這些研究的基礎上,一個交互設計師為了用戶與軟體交流,要耗費很長時間但要盡快地創作出這種令人稱奇的交互方式。 設計師必須識別出關鍵交互並且畫出線框圖, 所以要不停地畫草圖。有的設計師會直接畫出來,有的設計師會用軟體來輔助(文末展示了一些不錯的例子),還有其他一些設計師會或單獨或合作地創作界面。 交互設計(IxD)不斷地展現出新的交互方式,因為用戶總是期望網站出現新的事物。但交互設計師需要意識到這些特性會如何影響用戶,然後在許多想法中選擇真正要實現的和可以放一段時間的。 下面我們將會看到一些驅動交互設計的概念。 目標驅動設計 盡管IxD不需要做,但為了獲得最好的設計反饋,用戶研究查至關重要。用戶使用軟體時,一般在心裡有一些目標,你的應用程序應當很好地滿足這些目標。為了成功地結合設計和功能,用戶研究恰恰是最重要的元素。 這是如此的重要,以至於許多用戶研究員也能找到做交互設計師的工作,就是因為他們在分析用於軟體的人類行為模式方面的技能。 簡單化 人們不知道用戶界面是什麼。事實上他們也不關心。他們不知道有人在網站的背後策劃著他們所見到的一切。他們只知道他們需要一個簡單的網站。他們要一個易用的系統,載入/響應速度快,不要讓用戶思考並且不給用戶傷痛的理由。 情景和模式 我們使用的一些產品通常功能設計的很明確,因此每一個人都知道怎麼使用它們。拿剪刀做例子吧。一個三歲的小孩都知道怎麼使用它,兩個手指伸到兩個環中,只有一個活動方式能使用它。沒有比這更簡單的了。你的網站應該向一把剪刀一樣簡單易用。 為什此處使用」情景」這個單詞呢?因為這個詞表達了一個網站或者系統背後一些列的功能。 關於模式,用戶界面應當由一系列用戶熟知的組件組成,如果用戶想提交一個表單,他們首先會找到提交按鈕。這個按鈕就是個常見元素,設計者沒必要在接受一個新項目時每次都重復早輪子。 有些人會說了仿照現有的模式,不重新造輪子會讓人感覺沒有創新性。在易用性沒得到保障時討論創新簡直就是白痴。記住,易用性和創新性是兩碼事。 如果你想創新,你仍然需要了解已知的模式。但是,如果你追求高易用性,沒有人鼓勵你去重復造輪子,因為用戶需要時間去適應你的輪子。 創建一個高易用的系統需要交互設計師對約定,情景和web易用性有較深的理解。 現在你了解了一些交互設計的原則,接下來讓我們看看一個優秀的交互設計是如何影響用戶的。 訪客定位 交互設計師需要了解他們的設計面向哪些用戶,因此他們能通過用戶給產品做好定位。 頁面上顯示出用戶停留的地方,這樣的體驗不會讓用戶在瀏覽時感到困惑。用戶也能知道如何從一個頁面跳轉到另一個想去的頁面。讓用戶知道當前所在的位 置這是非常重要的,不要讓他們陷入死胡同中。當搜索沒有查詢出結果,沒有告訴用戶下一步操作的選擇,這樣的交互體驗是很糟糕的。 持續對話 交互設計把大量精力專注於給予用戶持續的反饋。告訴用戶他們做的是對還是錯,即使在無意識的層面上,這也是一個受用戶歡迎的元素。 你只須在用戶完成動作的時候,告訴他們已經成功了。 當你在亞馬遜上買一件東西時,你會在瀏覽器上和你的郵箱里獲得一份確認書。當你通過聯系表單提交郵件時,你會在頁面中獲得一份確認書。 這使得交互不僅僅停留於網站的瀏覽和特性使用,更是把交互帶到了一個新的層面:它幫助用戶更好地理解他們當前的狀態,並把疑惑和問題減到最少,同時也去除了用戶的挫敗感。 思考工作流 IxD還要考慮工作流。如果你有一張注冊表單,用戶用它提交信息是會有什麼事發生?頁面會刷新嗎,會跳轉到首頁嗎,會顯示確認信息嗎,會跳轉到登陸頁面,或者同時跳轉到上兩個頁面嗎? It』s about having many choices and choosing the one that will fit your users expectancies best. 提及的所有元素都是網站工作流的一部分。每次交互後應該緊跟下一個符合邏輯的步驟,並且與你網站之前所創造的體驗相符。 視覺層次 為了讓用戶照你的意思操作,你可以使用視覺層次來幫助他們。你可以使用布局、元素大小和顏色組合達到視覺突出的效果,以此來引導用戶的雙眼。 你也可以使用視覺層次使用戶找到他們想要的東西。你想租車嗎?保證你能使用視覺層次來引導用戶來到」租賃」頁面。 良好的線框化工具 繪制草稿和線框圖是如此重要,因此我願意向你展示一些好用的工具,這樣你就能馬上開始交互設計工作了。 Mockingbird Mockingbird是一個基於web的應用,在這個網站上用戶可以創建、連接、預覽和分享站點或應用的框圖。它的界面簡潔友好,用戶可以拖放元素,調整大小,甚至可以通過一個鏈接與同事方便共享。 因為Mockingbird是一個基於Web的應用程序,這意味著你從任何一台計算機無處不在地創建和修改你的構思。 Lovely Charts Lovely Charts是一個在線的圖表應用,它允許用戶創建流程圖、組織架構圖、站點地圖和流程框圖。 該應用程序的主要特色功能是依據你所繪制的內容進行推測建議–這有助於繪圖過程的簡化,返回老版本和撤消更改也很容易。 Mockflow MockFlow也是一個很好的Web應用程序,它有干凈簡單的組織界面和一系列廣泛的功能特性。 使用起來也使用拖放,有從圖表到菜單,廣告和下拉菜單等內置組件。你可以上傳自己的圖片或選擇網站提供的通用素材,所以構建框圖的過程是很快的。 SimpleDiagrams simplediagrams是另一個幫助用戶通過創建框圖表達自己的想法的桌面應用程序,它和上面提到的應用一樣使用相同的拖放技術來實現。 盡管較其他應用沒那麼多的功能,但simplediagrams提供了能幫助用戶創建框圖更快速的基本工具。 介紹完simplediagrams今天的文章該結尾了。別忘了用戶測試的重要性,記住創新和可用性通常會走向不通的方向。當創造神奇的交互界面的時候不斷創新,專注於如何讓使用它的人更加方便。 將這些牢記在心裡,你會成為一個優秀的網站或應用程序交互設計師。 你怎麼認為這個優秀的交互設計領域?你之前嘗試過設計一個類似的介面元素沒有,或是知道這些原則之後它是否為你所嚮往呢?

Ⅷ 如何讓搜索引擎搜索結果更精準

當用戶在搜索框輸入一個關鍵字後,我們應該給用戶返回什麼內容呢?一、搜索引擎原理和用戶使用習慣1.1 搜索引擎是一個可供所有人檢索的資料庫圖1:搜索引擎簡單的人機交互過程其中:1)被檢索的資料庫即搜索引擎所抓取的網頁數據。通過蜘蛛爬取到原始數據後,搜索引擎會對其進行處理後才入庫。即搜索引擎的搜索演算法,比如大家熟知名字( 當然是名字啦,內容原理是最高機密) 的Google的PageRank。2)搜索引擎是高度簡化後的產品。用戶需要做的即是輸入想要檢索的關鍵詞,確定,查看結果。這里有個需要說明的是,用戶連搜索條件都不需要輸入。而對搜索引擎來講,不僅要在海量數據中快速找到相關結果,還要揣測用戶的期望並提取正確的內容給用戶,內部的機制已經不能用繁瑣來形容了。這個難度就好比在大量圖書中快速准確找出某一個未知問題的答案一樣。圖2:剛拍攝的國家圖書館,使用了濾鏡。1.2 搜索引擎數據處理過程搜索引擎是一個超級復雜的系統,內部具體的處理規則和技術原理不可能是簡單的闡述清楚。我們通過產品的思維來理解一下這個過程即可。拿寫論文的例子分析即可,論文在成文之前材料的整理過程大致如下:1)從網路、圖書館、書籍雜志、講座等等收集大量原始資料2)排除相關重復內容3)排除跟主題關聯性不大的內容4)根據主題、邏輯順序、優先順序等進行人為的計算、分析、排版、處理等。這個過程是最為繁瑣和耗時的,使用的武器便是史上最牛逼的工具:人腦!!!5)成文輸入結果忍不住再重申一下:所有的產品其實都是在模仿人類的實際社會活動。。。明白這個對於產品經理很重要哦。搜索引擎數據處理流程基本類似(想要了解的可以自行搜索相關資料),唯一的也是搜索引擎想消除的區別:一個是有感情有邏輯的人腦在分析,一個是機器按照一定規則來分析。所以,想要搜索結果更精準,那就讓它像人腦一樣分析輸入數據並輸入結果。恩,我也覺得不怎麼現實,但是可以想辦法讓他比較精準。二、獲取信息的方式我們還是先從日常行為的來入手然後再推導產品的操作方式。2.1 通常,我們從周圍環境如下獲取信息:1、 已知獲取途徑和方法如想獲知今天美元對人民幣的匯率抑或北京飛青島的機票價格和時刻表,因為途徑已知,此類信息只要按圖索驥即可。差別在於不同途徑的成本。匯率可通過網路查詢、電話咨詢、銀行網點詢問等,顯然第一種方法更便捷。(的確是廢話)。這些信息都是規則化,概念明確的。2、了解核心關鍵需要整理的如剛才提到的論文寫作,假設題目為弱關系社區設計,我們就需要去詢問什麼弱關系,和強關系有什麼區別,已有的設計案例是什麼。這些信息的獲取建立在人為分析的前提下。2.2 提問方式還是舉兩個例子。1、 在形成完整的序言邏輯前,小孩子提問的方式是最簡單的關鍵詞,大人們要做的便是通過他的咿呀來理解孩子的需求。一般大人都能准確預測,原因在於其非常了解孩子的習慣、行為、方式、特徵 等。2、有了完整的語言邏輯後,我們一般選擇直接提問:今天的匯率是什麼?北京飛青島的票價多少,都是幾點的?人腦也完全可以處理這些問題。當然,人是復雜的感情動物,好多東西還不能完全通過字面意思去理解。說一個不是很恰當的例子:約會中,女孩提問你覺得現在的房價如何。字面意思是房價,潛在意思是你的購房能力如何。2.3 搜索引擎該這么處理假設搜索引擎具有跟我們一樣的大腦的話,那他處理問題的方式應該是這樣的:1、分析所查詢的問題是檢索關鍵詞還是提問2、結果分為三種,答案已知直接輸出結果;途徑已知,輸入解決途徑;提供最符合用戶預期的排序結果共用戶挑選3、不同的情況下會出現相互組合。當搜索引擎對關鍵詞理解越充分時,結果越准確。三、改進方法和策略再總結一下用戶的操作行為:3.1 當用戶輸入的為關鍵詞時:1)已知用戶的特徵,根據其特徵對搜索結果進行符合其本身的排序2)未知用戶特徵,則視為普通的查詢。提供結構話的搜索結果,即具有相關性的提示,相關性越高,結果越靠前。3.2 當用戶進行提問時:1)分析提問的語義,簡單的語義輸出結果或途徑2) 無法分析確切的語義,提供多個結果給用戶,同時根據用戶的反饋不斷調整結果。這也是用戶特徵的一部分。3.3 搜索結果出現交叉時,痛癢還是需要參考用戶的行為特徵來對結果排序。有幾個名詞,感興趣的可再去搜索一下:Bai-框計算;Google-知識圖譜;Facebook-社交圖譜搜索;Siri-語義搜索;概率-馬爾可夫模型。說白了,就是搜索引擎對用戶的搜索意圖越理解,資料庫越完備,輸出的結果越精準。還是舉個例子來佐證一下:同樣一個問題,好朋友的解答一般比陌生人要好,因為好朋友更了解你提問的動機,背景甚至期望得到的答案。問題來了,計算機畢竟不是生物,他執行的僅僅是規則。能做的便是收集你的一些行為和特徵來推斷你的喜好:1、個人信息:姓名、性別、籍貫、職業、行業、興趣愛好、使用偏好等。2、個人行為:搜索記錄、瀏覽記錄、社交行為等3、處理方法:聚類、分類、數據挖掘恩,其實是一個推薦引擎。更多知識和操作方法可以看一下Ibm Developer的文章:探索推薦引擎的秘密。