企業(yè)做網(wǎng)站網(wǎng)站歸檔技術(shù)和標(biāo)準(zhǔn)不完備
日期 : 2021-10-03 22:49:44
網(wǎng)站歸檔技術(shù)和標(biāo)準(zhǔn)不完備。網(wǎng)頁(yè)信息采集主要針對(duì)靜態(tài)或動(dòng)態(tài)網(wǎng)頁(yè)及其中文件,隨后提取網(wǎng)頁(yè)內(nèi)的全部信息。靜態(tài)網(wǎng)頁(yè)與動(dòng)態(tài)網(wǎng)頁(yè)的抓取難度也不相同,靜態(tài)網(wǎng)頁(yè)的抓取從技術(shù)上較易實(shí)現(xiàn),只需按時(shí)間頻率定期進(jìn)行即可;而動(dòng)態(tài)網(wǎng)頁(yè)的捕獲則無(wú)法單純依靠抓取軟件實(shí)現(xiàn),且以目前的技術(shù)條件無(wú)法實(shí)現(xiàn)安全存儲(chǔ)。此外,隨著網(wǎng)頁(yè)技術(shù)不斷發(fā)展,網(wǎng)頁(yè)文件類(lèi)型和格式不斷更新。
除了傳統(tǒng)的HTML格式文件以外,Java文件、Ac-tive X文件、Jpg圖片文件等新型格式的網(wǎng)頁(yè)文件也層出不窮,但目前尚未有明確標(biāo)準(zhǔn)規(guī)范來(lái)指導(dǎo)這些文件歸檔。
除了傳統(tǒng)的HTML格式文件以外,Java文件、Ac-tive X文件、Jpg圖片文件等新型格式的網(wǎng)頁(yè)文件也層出不窮,但目前尚未有明確標(biāo)準(zhǔn)規(guī)范來(lái)指導(dǎo)這些文件歸檔。