由於網際網路WWW的迅速發展,所以現有愈來愈多企業及一般網路使用者等都會透過Web來呈現他們的訊息或資料
;而網路服務(WebServices)的盛行如網路書店、網路購物、入口網站等諸多服務更是帶動了網路使用爆發性的成
長,而這些的類型網站通常會提供了一個搜索介面來便利使用者進行資料的查詢,例如透過一個CGI程式來進行該網
站的資料庫搜索,並將與使用者查詢相關的資料嵌入到一個固定的網頁製作設計技術高雄地區的樣版中(Template)
後呈現該網頁製作設計技術高雄地區的網頁給使用者觀看,而此方式所產生的網頁製作設計技術高雄地區的網頁我們
稱之為動態網頁製作設計技術高雄地區的網頁(Dynamic HTML)。從這些網頁製作設計技術高雄地區的網頁中,我
們不難地可以觀察到:這些網頁製作設計技術高雄地區的網頁往往夾雜了多種不同來源的廣告或是不相關於使用者查
詢的資訊;為了過濾這些雜訊以及資料收集的簡便,於是便有資料擷取(Information Extraction)研究因應而生,希
望透過資料擷取系統來減少資料收集工作的瑣事。而此種系統對於資訊整合的工作者來說甚為重要,因為欲對不同網
站上的進行資料整合工作時,他必須需要先手動地將不同網站的資料內容ㄧㄧ擷取出來,並將該資料存到Excel或是資
料庫中後,才可進行後端的資訊整合步驟(Information Integration),以提供一套整合性的網路服務或資料分析。但
是由於網站開發者常常會因為需求的變更,而對於其網站進行若干的修改,造成原本已整合完成的工作得重新進行擷
取分析、並整合等複雜的重複工作。
有鑑於此,近來有許多自動化的網頁製作設計技術高雄地區的網頁擷取系統被廣泛的討論,它們從一群網站所收集回
來的動態網頁製作設計技術高雄地區的網頁中,透過網頁製作設計技術高雄地區的網頁之間的比對來產生該網站動態
網頁製作設計技術高雄地區的網頁資料的擷取模組,稱之為Wrapper,並且利用該模組來進行該網站的動態網頁製作
設計技術高雄地區的網頁資料擷取;而此擷取模式不僅簡便了網路資訊整合者的工作,更可以加速處理於不同類型的
網站整合工作使用。
|