閱讀屋>資料庫作業系統> 非結構化WEB資料庫與圖書館多媒體資訊資源的組織利用論文

非結構化WEB資料庫與圖書館多媒體資訊資源的組織利用論文

非結構化WEB資料庫與圖書館多媒體資訊資源的組織利用論文

  【內容提要】針對傳統關係資料庫在處理非結構化多媒體WEB資訊中所存在的問題,結合圖書館多媒體資料庫的特點及特定技術要求,介紹了非結構化WEB資料庫的技術特點及其在組織與利用館藏多媒體資訊資源中的作用。

  【摘要題】資訊資源建設

  【關鍵詞】非結構化WEB資料庫/多媒體/資訊資源/組織利用/關係資料庫

  【正文】

  1 非結構化WEB資料庫簡介

  非結構化WEB資料庫,是指其欄位長度可變,並且每個欄位的記錄又可以由可重複或不可重複的子欄位構成的基於INTERNET、INTRANET的資料庫,用它不僅可以處理結構化資料(如數字、符號等資訊)而且更適合處理非結構化資料(全文文字、圖象、聲音、影視、超媒體等資訊)並在網際網路上釋出。非結構化WEB資料庫主要是針對非結構化資料而產生的,與以往流行的關係資料庫相比,其最大區別在於它突破了關係資料庫結構定義不易改變和資料定長的限制,支援重複欄位、子欄位以及變長欄位並實現了對變長資料和重複欄位進行處理和資料項的變長儲存管理,在處理連續資訊(包括全文資訊)和非結構化資訊(包括各種多媒體資訊)中有著傳統關係型資料庫所無法比擬的優勢。

  2 圖書館多媒體資訊資源的特點及組織利用中的技術要求

  2.1 圖書館多媒體資訊的資料量非常大,象館藏影視資料和各種多媒體教育資料,其動態圖象訊號,每秒可達數兆位元組,一段幾分鐘的MP3音樂也有幾兆位元組,即使經過壓縮、也十分巨大。如何對多媒體海量資料進行有效地組織、儲存並構成WEB資料庫提供給使用者網上使用,技術要求很高。

  2.2 館藏多媒體資訊的資料型別很多,包括各種圖文資料、聲音資料、影視資料、超媒體資料、多種格式的隨書光碟等等,其資料長度不固定,結構上的差異大,使得處理這些資料十分困難,要求資料庫既能夠處理可變長度欄位又能夠處理可重複的子欄位。

  2.3 多媒體資訊處理在時間上要求很高,多媒體資訊中的聲音和動態影象對時間特別敏感,在使用這些資訊時,必須保證其時間上的要求,否則將會使這些資訊失真甚至變得毫無意義。

  2.4 開發利用館藏多媒體資訊資源經常要多種資訊整合描述,比如某種多媒體,既有影象,又有聲音,還有文字說明,這樣就會改變傳統的資料庫操作形式和資料庫介面,尤其對圖文並茂的資料庫的建立和查詢,需要統一語義描述。

  基於多媒體資訊資源的上述特點,要想使館藏豐富的多媒體資訊資源得到充分利用,滿足資訊使用者不斷增長的資訊需求,對多媒體資訊處理提出了不同於普通訊息處理技術的新要求:

  (1) 多媒體資料庫元資料儲存技術要求

  我們知道音訊、圖象、影片等多媒體資訊資料是非結構化的,它們不能用簡單的數字解析式表示,多媒體資料庫必須取得基於這些媒體物件內容及資訊特徵的解釋,才能完成儲存及應用,這些解釋就稱為元資料,透過對元資料的歸類、整理、實現標準化的儲存是多媒體資訊資源組織利用的關鍵。多媒體資料庫元資料儲存技術要求包括:文字元資料的存取,語音元資料的存取,圖象元資料的存取,影片元資料的存取等方面的技術要求。

  (2) 多媒體資料庫結構欄位設計與資料記錄處理方面的要求

  a.允許可變長欄位、可重複欄位、子欄位和MARC欄位。

  b.資料庫記錄的數目與記錄長度,欄位數目與欄位長度,欄位可重複次數不應受到限制。

  c.允許建立可以快速存取的倒排檔案和多媒體、多語言記錄表。

  d.資料庫可自動接受和產生MARC和ISO2709記錄格式的檔案,並且滿足對MEDADATA資料模式的支援功能。

  (3) 基於WEB的多媒體資訊檢索與資訊釋出的.技術要求

  隨著使用者對於資訊需求的大量增加,以及對於多媒體資訊的實效性要求,基於WEB的資料庫資訊儲存的檢索越來越傾向於多媒體全文資訊檢索的查詢語言,並且對於檢索結果的需求也側重於多媒體全文資訊的獲取。與此同時,WEB資料庫的資訊釋出形式開始更多地過渡到透過網路瀏覽器以多媒體電子文件的方式(B/S)傳輸給網上使用者。也要求利用多媒體WEB傳輸技術,向用戶提供主動的特定多媒體資訊的推送服務。

  3 非結構化WEB資料庫的特點及其在組織與利用多媒體資訊資源中的作用

  3.1 豐富的資料型別與靈活的資料結構,滿足多種型別館藏多媒體資料結構組織

  根據非結構化多媒體資料資訊的特殊性,非結構化WEB資料庫在進行儲存和管理多媒體資訊時,整個資料庫的管理機制擯棄了傳統結構化關係資料庫對於資訊採取定長和結構化定義和管理的侷限,它從多媒體資料模型入手,採用子欄位、多值欄位以及變長欄位的機制,允許建立許多不同型別的非結構化或任意格式的欄位,從而突破了關係資料庫非常嚴格的表結構,解決了關係資料庫模型過於簡單,不便於表達複雜巢狀的問題。非結構化WEB資料庫在資料型別上不僅支援字元型、數值型資料,而且由於具有很強的外部檔案支援功能,使其可以支援如超長文字、影象、聲音、動畫等多種多媒體擴充套件資料型別。與傳統關係資料庫相同之處是非結構化WEB資料庫的資料結構也是建立在二維表的基礎之上的,但它與關係資料庫不同的是:(1)非結構化WEB資料庫二維表的屬性長度是不可變的,在列的維度上可以隨意擴充套件,這就能較好地滿足多媒體資料處理時,需要靈活的可變長欄位的要求。(2)非結構化WEB資料庫由於支援重複欄位、子欄位,使其可以在資料庫記錄中實現二維巢狀,解決了非結構化多媒體資料結構複雜、可能存在重複欄位和多個巢狀子欄位的問題。(3)非結構化WEB資料庫一個欄位可以存放關係資料庫的一張表,它可以在一張表中壓縮關係資料庫中一對多的關係,因此利用非結構化WEB資料庫能很好地實現多種多媒體資料庫的集中組織與管理。

  3.2 基於廣域網的圖書館海量多媒體資料庫儲存管理機制的實現

  圖書館多媒體資訊資源資料庫是海量資料庫,支援基於廣域網的海量多媒體資訊儲存和管理是非結構化WEB資料庫管理系統的主要功能之一,不僅儲存資料量大,而且存取速度快,同時檢索功能強、檢索速度快,在檢索速度方面一般不受資訊量大的影響。以IBASE非結構化資料庫為例,每個資料庫最大的記錄數可達到1000萬條,每條記錄的最大長度可達64000位元組。每個資料庫最多可有800個欄位。

  3.3 利用多種索引方式,實現多媒體全文檢索、媒體特徵檢索等多種檢索策略

  館藏多媒體資訊資源組織利用的關鍵是要實現多種方式的多媒體全文檢索,而要實現多種檢索方式,建立索引是前提,傳統關係資料庫支援的索引只限於單欄位索引、複合索引等幾種方式,受其限制,關係資料庫檢索能力也受到很大限制。非結構化WEB資料庫由於有著靈活的資料結構,在其底層儲存機制變革的基礎上,採用先進的索引倒排擋技術,使它支援的索引方式比關係資料

  庫要豐富得多,可以滿足極其複雜檢索的需要,實現對於海量多媒體資訊的快速全文檢索功能,它支援欄位索引、子欄位索引和全文索引甚至可以支援人工標引索引,中英文混合索引等方式。配合非結構化資料庫的格式化語言,可以對同一欄位進行若干種不同的索引,以滿足特殊檢索的需求,實現多種檢索策略。例如IBASE非結構化資料庫管理系統目前支援8種不同的索引方式,可以涵蓋所有關係資料庫所提供的90%以上的檢索方式,同時還提供了包括簡單檢索、組合檢索、欄位檢索、右截斷檢索、全文檢索、擴充套件檢索、相關檢索、集合檢索、媒體特徵檢索等等大量關係資料庫所不具備的檢索方式和檢索策略。

  3.4 整合WEB伺服器和資料庫伺服器,實現多媒體網路資訊釋出與多種服務功能

  關係資料庫在基於因特網應用時,由於結構模型等原因的限制,不能與因特網完全地融合,需在WEB伺服器與資料庫之間加入大量的中介軟體,從而在無形中加大了資料庫基於網路應用的難度,給資料庫在因特網應用帶來了新的網路瓶頸,應用伺服器由於與資料庫頻繁互動,其本身的效率和資料庫檢索效率易造成因特網應用的阻塞。非結構化資料庫模型全部是基於因特網,採用WEB伺服器和資料庫伺服器緊密整合的方法,可以將目前傳統資料庫廠商由C/S結構擴充套件來的瀏覽器/WEB伺服器加應用伺服器/資料庫服務的三層體系結構,整合瀏覽器/WEB資料庫釋出系統(B/S)的因特網計算結構,使多媒體資料庫系統成為WEB的一個重要有機組成部分,實現在單一平臺上融合所有多媒體資料庫和應用伺服器的功能,這不僅大大減少了使用者對多媒體資料庫額外硬體、中介軟體和其他昂貴的整合業務的需求,而且極大地縮短了使用者開發和採用基於因特網應用的時間,有利於使用者把更多時間用於多媒體資訊資源的開發和描述,非結構化資料庫管理系統可以為系統建設者提供快速有效的方法實現基於WEB的多媒體資料庫的建立和資訊檢索釋出,實現網上多媒體資訊檢索、線上點播、閱讀,圖書館多媒體資源聯合編目和聯合建庫。同時,利用非結構化WEB資料庫還可以實現許多新的多媒體資訊服務功能,如採用多媒體資訊推送技術和郵件伺服器功能實現定題服務和個性化多媒體資訊服務。

  【參考文獻】

  1.朱繼團.非結構化型別網頁的全文檢索

  系統設計.現代計算機,1998(9)

  2.張忠友.基於IBASE非結構化網路資料庫的IPAC圖書館網上資源釋出與檢索系統.中國資訊導報,2001(2)

  3.張忠友.數字化圖書館與非結構化資料庫.中國資訊導報,2001(6)

  4.李慧,顏顯森.資料庫技術發展的新方向——非結構化資料庫.情報理論與實踐,2001(4)

  5.朱斌,宋先忠.非結構化資料的資訊服務系統設計方法.計算機時代,2001(7)

  6.田辛玲,劉衝嬌.電子化圖書館多媒體文獻服務系統的建設與實施.現代情報,2002(6)

  7.蔡清萬.多媒體技術與數字圖書館建設.圖書館工作與研究,2001(2)

  8.李娟.多媒體資料庫開發.情報理論與實踐,2001(1)

【非結構化WEB資料庫與圖書館多媒體資訊資源的組織利用論文】相關文章: