《用低代價(jià)的服務(wù)器過程將文檔處理自動(dòng)化》文章已經(jīng)歸檔,站長之家不再展示相關(guān)內(nèi)容,下文是站長之家的自動(dòng)化寫作機(jī)器人,通過算法提取的文章重點(diǎn)內(nèi)容。這只AI還很年輕,歡迎聯(lián)系我們幫它成長:
首先是最簡單的首先,對于快速的人可讀性、粗略的字?jǐn)?shù)統(tǒng)計(jì)等而言,用字符串掃描.DOC文檔通常是足夠了。像stringssomething.doc|wc-w這樣的命令返回的字?jǐn)?shù)統(tǒng)計(jì)值通常誤差在10%以內(nèi)。對這樣粗糙的方法進(jìn)行改進(jìn)會(huì)非常困難。問題的核心在于.DOC作為一種格式,在這些年里已經(jīng)進(jìn)行了很大的更改。難于跟蹤。相關(guān)的.RTF有幾個(gè)優(yōu)勢:它用ASCII進(jìn)行編碼,幾乎具有人工可讀性,并且它不太可能被病毒傳染。而且,這些年里它已經(jīng)顯得穩(wěn)定多了;1997年的閱讀器多半能理解今年編寫的.RTF,反之也是。在我所管理的一些網(wǎng)絡(luò)上,我進(jìn)行了流量限制:把.DOC排除在外,而贊成使用.RTF,以預(yù)防惡意代碼。原則上說,這剝奪了用戶使用某些字處理特性的權(quán)利,而這些特性只能從.DOC獲得。實(shí)際情況是,我從未遇到過一個(gè)這樣的用戶:他(或她)真正使用了一種用.RTF無法達(dá)到的效果。?...
......
本文由站長之家用戶“互聯(lián)網(wǎng)”投稿,本平臺(tái)僅提供信息索引服務(wù)。由于內(nèi)容發(fā)布時(shí)間超過平臺(tái)更新維護(hù)時(shí)間,為了保證文章信息的及時(shí)性,內(nèi)容觀點(diǎn)的準(zhǔn)確性,平臺(tái)將不提供完整的內(nèi)容展現(xiàn),本頁面內(nèi)容僅為平臺(tái)搜索索引使用。需閱讀完整內(nèi)容的用戶,請聯(lián)系作者獲取原文。
(舉報(bào))