根據《國務院辦公廳關于印發政府網站發展指引的通知》國辦發〔2017〕47號及《政府網站網頁歸檔指南》DA/T80-2019,網站網頁歸檔勢在必行!今天筆者帶你走進北京冠群信息技術股份有限公司(簡稱冠群信息),了解更加專業的網站網頁歸檔技術。
何為 網頁歸檔 webpage archiving
網頁歸檔是對政府網站歷史網頁進行整理、存儲和利用的過程。政府網站遇整合遷移、改版等情況,要對有價值的原網頁進行歸檔處理。歸檔后的頁面要能正常訪問,并在顯著位置清晰注明“已歸檔”和歸檔時間。
網站網頁歸檔 的意義
在互聯網時代,各級政務網站作為政府部門的官方網絡媒體,其網頁是政府機構業務活動的記錄和憑證,是對政務公開等業務信息進行回顧、分析和證明的重要資源,具有憑證價值、情報價值和檔案價值。長期妥善保存網站網頁,對于記錄政府機構的職能活動及保存社會記憶有著重要的意義。
發達國家網站網頁歸檔工作
鑒于大部分網站網頁存活期不到一年,聯合國教科文組織已經將網站網頁列為重要的數字遺產來源。國際上發達國家早已經進行網站網頁歸檔工作。
1996年,美國成立了世界上第一個因特網檔案館,其任務就是將公開的網頁和數字形式的文化產品盡可能完整地歸檔,到2005年6月,已保存了400億頁網頁。
1996年,澳大利亞檔案館的網上檔案館正式運行,目標是長期保存有關澳大利亞的網上出版物和澳大利亞的網站,并為公眾提供檢索入口。
2004年,英國正式啟動第一個公眾網絡信息保存計劃UKWAC,對英國網站信息進行選擇性保存。
中國政府 網站網頁歸檔 工作
中國政府已認識到網站網頁數字遺產的保存工作的重要性,正在緊鑼密鼓推行該項工作。
2016年11月3日,中共中央辦公廳印發《國家電子文件“十三五”規劃》,明確提出推進政府網頁電子文件歸檔。
2017年5月,國務院辦公廳印發《政府網站發展指引》,指出網頁歸檔是對政府網站歷史網頁進行整理、存儲和利用的過程。
2019年12月27日,國家檔案局正式發布DA/T 80—2019 《政府網站網頁歸檔指南》,標志檔案行業正式啟動政府網站網頁歸檔工作。
網站網頁歸檔 , 中國核心技術企業在行動
冠 群信息 網站 網頁歸檔 管理系統 , 面向政府網站,進行網頁采集、生成、歸檔、管理、利用,實現標準格式的網頁電子文件集中存儲、統一管理和應用,從而達到對網頁電子文件長久保存利用的目的。滿足黨政部門對本單位網站歸檔的需求,可對網站網頁進行采集,并形成符合國家標準和檔案行業標準的電子文件,同時可保存原有網頁中的文字、圖形、圖像和鏈接邏輯等重要內容,歸檔后的內容可供用戶查詢利用。
—— 冠 群信息 網站網頁歸檔 系統 分為三個子系統 :
1.網頁采集系統。使用優化的網絡爬蟲技術,將指定網站的網頁采集下來,直接存儲為WARC文件。
2.網頁電子文件管理系統。將采集到的網頁經版式轉換服務轉換成OFD版式文件,然后存儲到網頁電子文件管理系統中,并依據電子文件管理系統通用功能建設要求,對網頁電子文件提供自動分類、設定保管周期、鑒定處置、查詢利用等管理功能。
3.網頁電子文件展示利用系統。用于重現不同歷史時間點上采集下來的網站網頁信息,利用時間軸方式提供網站展示、專題展示、關鍵詞檢索和下載等功能。
【關于冠群 信息 】
冠群信息是參與制訂網站網頁歸檔管理系統的核心技術—網頁轉換格式國家標準GB/T 33190《電子文件存儲與交換格式版式文檔》和DA/T 80—2019《政府網站網頁歸檔指南》)的廠家之一;是該系統另一核心技術WARC網頁存儲格式(國家標準GB/T33994《信息和文獻-WARC文件格式》)在中國的最佳實踐者,擁有自然資源部和國家信息中心等部委級成功案例;是中國網站網頁歸檔管理系統最有經驗的實施者,可以為政府快速構建基于SaaS模式或獨立模式的網站網頁歸檔管理系統。
免責聲明:以上內容為本網站轉自其它媒體,相關信息僅為傳遞更多信息之目的,不代表本網觀點,亦不代表本網站贊同其觀點或證實其內容的真實性。如稿件版權單位或個人不想在本網發布,可與本網聯系,本網視情況可立即將其撤除。
互聯網新聞信息服務許可證10120230012 信息網絡傳播視聽節目許可證0121673 增值電信業務經營許可證京B2-20171219 廣播電視節目制作經營許可證(京)字第10250號
關于我們 中宏網動態 廣告服務 中宏網版權所有 京ICP備2023030128號-1 舉報電話:010-63359623
Copyright ? 2016-2025 by www.fljgs.cn. all rights reserved 運營管理:國家發展和改革委員會宏觀經濟雜志社