揭開html
tidy的面紗, 網頁優化功能是ultraedit8.x版本的"format"選單中的"html
tidy"命令提供的。
html
tidy是ultraedit整合的第三方軟體,**
。ultraedit在幫助檔案中特別提示,html
tidy提供了大量配置選項,可以在配置檔案中設定,具體設定方法要看其**的文件。
這裡說明一下,影響ultraedit優化中文網頁的配置選項是char-encoding,該選項決定html
tidy如何解釋字元流,其值可以設定為raw, ascii, latin1,utf8或iso2022。在命令列工具中,預設值是ascii,在ultraedit中,經過本人測試,預設值是latin1。
設定值的含義:
ascii: 大於127的字元輸出時轉化為編碼單位;
latin1: 大於255的字元輸出時轉化為編碼單位;
raw: 大於 127的字元輸出時不轉化。
原來,設定char-encoding為raw就可以了。
優化中文網頁的例項
1.編輯html
tidy的配置檔案為了優化出**易讀、方便編的html檔案,在ultraedit的資料夾中(例如c:/programfiles/ultraedit),建立乙個名為cfgtidy.ini的檔案,其內容如下:
indent:auto
indent-spaces:2wrap:72markup:yesoutput-xml:noinput-xml:no
show-warnings:yesnumeric-entities:yesquote-marks:yesquote-nbsp:yesquote-ampersand:nobreak-before-br:nouppercase-tags:no
uppercase-attributes:nochar-encoding:raw
new-inline-tags:cfif,cfelse,math,mroot,mrow,mi,mn,mo,msqrt,mfrac,
msubsup,munderover,
munder,mover,mmultiscripts,msup,msub,mtext,
mprescripts,mtable,mtr,mtd,mthnew-blocklevel-tags:cfoutput,cfquerynew-empty-tags:cfelse
其中char-encoding的值為raw。
2. 配置html
tidy工作環境為了使html
tidy能夠使用配置檔案cfgtidy.ini,需要建立其配置環境,使ultraedit中整合的html
tidy能夠獲得配置檔案的完整路徑,有兩種方法。
方法一:windows9x在autoexec.bat中新增一條環境語句(需要重啟)
sethtml_
tidy=c:/programfiles/
ultraedit/cfg
tidy.ini
windows2000使用者開啟控制面板中的"系統",然後選擇"高階"標籤,單擊"環境變數"按鈕。在"系統變數"中,新建乙個變數名為
html_
tidy,變數值為c:/programfiles/
ultraedit/cfg
tidy.ini的變數。
方法二:在windows目錄(例如c:/windows或c:/winnt)中,找到
ultraedit的配置檔案uedit32.ini,在其中的[settings]下,新增如下內容(注意空格符號)
html
tidyconfigfile=c:/programfiles/
ultraedit/cfg
tidy.ini
在完成了上面的步驟後,現在啟動
ultraedit,開啟乙個中文網頁,選擇
html
tidy命令,
ultraedit將優化該網頁,返回的**結構非常 合理,而且中文沒有成為亂碼。
Python資料探勘 中文分詞
將乙個漢字序列切分成乙個乙個單獨的詞 安裝分詞模組 pip install jieba 分詞在特殊場合的實用性,呼叫add word 把我們要新增的分詞加入jieba詞庫 高效方法 將txt儲存的詞庫一次性匯入使用者詞庫中 import jieba jieba.load userdict d pyt...
海量資料探勘 DB優化篇
這裡我們將資料庫的優化,分為三個大的方面 在資料庫優化的方向上,沒有什麼正規化是絕對的,我們要根據情況設計合理的表結構,一味地追求完美的三正規化是乙個錯誤且固執的想法!分析 我們看,哪個更符合三正規化呢,明顯是第二個,因為第乙個設計有分值這個欄位的冗餘,也有得分的冗餘,這樣看第二個是合理的!但是在實...
海量資料探勘 DB優化篇
這裡我們將資料庫的優化,分為三個大的方面 在資料庫優化的方向上,沒有什麼正規化是絕對的,我們要根據情況設計合理的表結構,一味地追求完美的三正規化是乙個錯誤且固執的想法!分析 我們看,哪個更符合三正規化呢,明顯是第二個,因為第乙個設計有分值這個欄位的冗餘,也有得分的冗餘,這樣看第二個是合理的!但是在實...