十分鐘內學會 將HTML格式化為合法的XML

2021-09-05 15:52:23 字數 398 閱讀 6635

在**中需要引入來自外部的html,這是很正常的事情。例如允許使用者採用html直接發表時,或者聚合外部的feed時,這時候外部的html就直接嵌入到我們的**中。如果我們的**是設計為符合xhtml的,那就可能因為引入外部html而破壞掉xhtml的合法性,甚至連合法的xml都做不到。這時候我們就需要將外部的html格式化為合法的xml,以方便我們的處理。

需要說明的是,sgmlreader所使用的html.dtd比我們通常用的loose.dtd還要寬鬆,所以它僅僅能保持在盡可能相容輸入html的情況下,輸出合法的xml。如果你需要輸出符合xhtml,就需要使用更加嚴格的dtd,或者對輸出的合法xml再作處理。

最後,如果你覺得本系列的文章對你有價值,可以考慮訂閱cat in dotnet,可選的方式包括通過feed訂閱(和通過email訂閱(

十分鐘學會less

譯者 wleonardo 我們都知道在大型的專案中,當css有數千行 的時候,css的編寫有一些麻煩。我們經常會出現複製相同的 到不同的地方或者通過我們的編輯器來替換所有相同的顏色。這需要我們費很大的力氣去保持css的可維護性。但是其實我們並不是一定要這樣。幸運的是,web開發社群已經解決了這個問題...

十分鐘學會Excel匯出

excel匯出在內網系統一般用的很多,一般分為poi和jxl兩種,前者支援excel2003 xls 和excel2007 xlsx 而後者只支援excel2003 xls 所以我們這裡使用poi來做excel 的匯出 我們以匯出員工資訊的資料為例子 第一步 匯入poi的jar包 第二步,在前台寫乙...

課間十分鐘

時間限制 1000 ms 記憶體限制 128 mb 兩人都是數學愛好者,便發明了乙個遊戲。在遊戲開始前,他們先約定乙個正整數n,同時令m 1。遊戲過程中,每個人都可以將m的值擴大2到9中的任意倍數。第乙個使m n的人就是最後的贏家。181818181818和zbt都十分聰明,並且遊戲過程中都使用最佳...