通過收購和對搜尋技術的大規模研究投資,ibm正悄悄變成一位搜尋技術的領先廠商。ibm的搜尋目標是使查詢企業網路像使用google或yahoo進行web搜尋那樣普通和容易,ibm會成為企業搜尋技術的google?
microsoft也活躍在搜尋領域,幫助普及了在pc上搜尋的概念。它正在開發一種叫做winfs的新檔案系統,可大大方便挖掘儲存在不同程式中的資料的過程。同時,幾家較小的專業廠商已經推出了幫助企業使用者搜尋公司網路的文字儲存和檢索軟體。這些企業搜尋公司包括verity、autonomy、fast search & transfer以及幾家新興廠商。
forrester research公司分析師laura ramos說,企業搜尋產品起價一般在3萬美元以上,大型部署的費用可能超過100萬美元。idc估計,企業搜尋市場2023年取得了6.2億美元的收入並顯示出健康的需求,2023年增長了20%。
桌面搜尋進入企業
google欲贏者通吃
ibm欲做企業搜尋中的google?
ibm也在正在開發搜尋軟體,希望這種軟體能使它成為企業搜尋技術的google。據ibm資訊整合副總裁nelson mattos說:「自2023年起,ibm一直向一項巨大的資訊整合專案投資,以幫助公司整合和找到儲存在於企業不同位置的任何資訊。」
ibm目前正在推廣一項新標準。這項標準旨在實現幫助企業搜尋和分析分布在企業網路上的非結構化資料的軟體之間的互操作性。非結構化資料報括電子郵件、word文件以及沒有以行列格式儲存的任何內容。
ibm公司8月8日發布了新版本的websphere information integration omnifind edition企業資訊管理工具。新工具整合了「非結構化管理管理架構」(uima)的技術。uima設計用於改進對文件和其他非結構化內容源中的文字進行處理,來幫助尋找關鍵字之外的關係和含意。
mattos說:「這是企業界存在的頭號問題。」他補充說,研究顯示工作人員平均將30%的時間花在尋找相關資訊上。他說,大約85%的企業資料是非結構化的,因而不容易找到,這一事實使這個問題變得更加複雜。
ibm說,15家以上的公司已表示計畫支援uima作為一種搜尋和文字分析非結構化資料的框架。目前使用ibm的websphere information integration omnifind的專案包括用於汽車業處理保修要求、修理請求和可以幫助確定問題的呼叫中心日誌的質量控制預警系統以及用於反恐與執法的高階情報系統。
interarbor solutions分析師dana gardner說:「在分析非結構化文字時,現在有很多不同的方法,但是所有這些方法只能讓你粗淺地了解你可以得到的東西。」他說,利用uima,公司可以更全面地提取他們尋找的資訊。
實際上,據ibm資訊管理部總經理janet perna說,藍色巨人一直在悄悄地開發旨在大大提高公司尋找分布在網路不同位置上的業務文件能力的資料儲存軟體。
這種新軟體,連同ibm已經擁有的其他資訊檢索產品,將支援公司完成脫離低價硬體市場,進軍利潤更高的軟體與服務領域的轉變。perna說,此舉旨在加快ibm從一家關係型資料庫公司轉變為提供各種資訊管理軟體的提供商的速度。
perna說:「我們是靠關係型資料庫起家的。我們需要的是一種不僅儲存和管理而且還搜尋和訪問各種資訊的資訊基礎設施。」她說,這種新資料庫相關軟體將使企業客戶可以以xml格式儲存文件,這將大大加快文字相關查詢的速度。這種工具的乙個早期版本,即alpha版本正在由30來家客戶進行測試,預計於明年下半年完成。
關係型資料庫是企業的支柱,用於儲存記錄和交易資料。perna說,但是,大約85%的業務資訊儲存在所謂的非結構化資料來源中(如字處理檔案、xml文件和影象),因而難於查詢。他說:「幾乎所有人都熟悉像google或yahoo這樣的搜尋功能。因此我的設想是我們可以以類似的模式暴露業務資訊。我們將取得成功,因為不需任何培訓。」
他說,公司雇員常常通過口頭傳播來了解業務報告,或者他們委託編寫報告,而報告可能已經寫出來了並儲存在一家公司的伺服器上。搜尋已有報告資訊庫將大大加快這一過程,並可能消除某些多餘的工作。
分析人士說,隨著ibm擴大自己的範圍,可能將與microsoft和oracle以及一些專業從事企業搜尋(如文字檢索)開發的小公司發生衝突。
idc的feldman指出,其他公司也在進軍企業搜尋市場,但銷售處理不太複雜任務的較簡單的產品。如google的搜尋引擎不允許進行大量的搜尋定製。
microsoft也活躍在搜尋領域,幫助普及了在pc上搜尋的概念。它正在開發一種叫做winfs的新檔案系統,以方便挖掘儲存在不同程式中的資料的過程。同時,幾家較小的專業廠商已推出了使企業使用者搜尋公司網路的文字儲存和檢索軟體,包括verity、autonomy、fast search & transfer以及幾家新興廠商。
搜尋企業要複雜得多
搜尋企業網路可能比搜尋web要複雜得多,儘管資訊量可能要少得多。
與在web上不同,企業資訊可能儲存在很多位置中並且有各種各樣的格式,如電子報表、pdf、網頁、甚至多**檔案。企業客戶還需要可靠的儲存系統(如資料庫)以及協作、安全和跟蹤法規遵從性的工具。
另乙個與web搜尋的重要不同是企業網路中複雜的搜尋應用涉及從多個源採集資訊和建立資訊的關聯。例如,汽車製造商可以通過挖掘儲存在客戶支援電子郵件和製造應用程式中的文字文件,發現潛在的危險和昂貴的產品缺陷。
idc估計,企業搜尋市場2023年取得了6.2億美元的收入並顯示出健康的需求,去年增長了20%。idc分析師sue feldman說,隨著不同的公司競爭企業資訊管理市場的份額,傳統內容管理提供商與專業搜尋與文字檢索公司之間的衝突是不可避免的。
feldman說:「內容管理廠商和搜尋廠商一直非常愉快地共存。現在我們將開始看到兩類廠商的聯合。這種新興資訊基礎設施正是ibm進軍的領域,也是oracle、可能還有其他一些廠商進軍的領域。」
ibm通過收購、通過篩選其研發試驗室的成果,構建內容管理與搜尋產品線。ibm研究部門中大約有300人致力於搜尋相關課題的研發。
包括webfountain的試驗室技術開始出現在產品中。乙個名為cinnamon的專案帶來了ibm db2 content manager中xml文件處理功能的改進。db2 content manager預計於明年上半年公升級。從傳送產品角度看,ibm今年年初在推出db2 information integrator(代號為masala)時,取得了進入企業搜尋領域的立足點。作為ibm資料庫的附件,masala使業務人員可以查詢異構的資料來源。
憑藉即將推出的xml資料庫,ibm將在一種樹形結構中儲存和索引xml文件,這種儲存方法應當大大提高文字的搜尋速度。
市場上已出現了專用的、本機的xml資料庫,但ibm的perna說,藍色巨人的產品將具有工業強度的效能和其db2產品的規模。kawasaki的martinez說,ibm的技術設想十分誘人,因為它的搜尋技術是為處理不同型別的資訊和操作環境而設計的。
ibm在關係型資料庫市場名聲赫赫,並具有大型機資料庫提供商這樣的遺產,但是直到不久前,它的大多數與搜尋相關的工作一直是在試驗室中進行的。martinez說,事實上,藍色巨人在企業搜尋市場中面臨的挑戰可能是它的形象,而不是實際的技術。
他說:「當你想到搜尋時,不會想到ibm。」
計世*** 2005-8
無框的搜尋時代來臨 誰將是搜尋的王者
前幾天搜狗推出智慧型版輸入法2.0版本,裡面有乙個功能叫有靈犀的新功能,這個功能的作用是這樣的 當使用者在搜尋引擎頁面輸入關鍵詞時,搜狗輸入法的候選詞欄會根據關鍵詞的不同,向使用者提供相應的迷你搜尋結果。比方搜尋最近熱播的笑傲江湖,使用者剛打出電視劇集名,搜狗輸入法給出這一電視劇集相應的收看鏈結。所...
google搜尋的使用
你真的會使用google麼?如今遇到問題都會在搜尋引擎中尋找答案,如何快速準確的尋找出你想要的答案是個問題。近期看了一篇文章 如何使用google解決問題 獲益良多,現總結一下。1.關鍵字的選擇 關鍵字的選擇十分重要,一兩個關鍵字選擇的恰當會直接給出你想要的搜尋結果。如何選擇關鍵字呢?answer ...
Google搜尋的用法
google是我們這個時代最偉大的產品之一。有了google,本質上誰都有能力做 research 研究 research 在今天已經不再像許多年前那樣是少數 精英 的專利了。我常常告訴我的學生,research 其實一點都不神秘 所謂的 research 其實只不過是 search,search,...