按理說現在office都支援unicode,怎麼寫都不會亂碼。
實際上,visio裡面還存在,在圖的名字上如果用日文就會亂碼。
而且明明選好的日文,再開啟又是中文了。鬱悶
還好office現在都有xml格式,儲存後的xml為unicode編碼,裡面的亂碼就是日文了。
1. 先剔除xml: 連續的char大於oxff是漢字語句
2. 亂碼轉中文:encoding.getencoding("shift_jis").getstring(encoding.default.getbytes(word))
3. 自動區分亂碼日文:根據轉碼前後的字元數變化。正確中文轉日文後會變長,亂碼日文轉日文後不變
4. 上面長度判斷法會有少數誤判,做個保留詞彙表,用於剔除誤判的。
28m的xml掃瞄一次3秒,轉換一次5秒。轉換後基本正確,開啟後再儲存為二進位制格式**。
**和程式:
PDF檔案,日文顯示亂碼的解決方案
adobe reader電子圖書格式pdf中,日文顯示為亂碼怎麼辦?pdf是一種常見的檔案格式,與word相比,具有能儲存檔案版面 字型顯示柔和等優點。滬江日語經常會使用pdf檔案格式來為大家整理一些論壇上的資料。閱讀pdf檔案必須安裝acrobat reader軟體,但是往往會在開啟含有日文字型的...
給開發處理office文件的經驗
1.從內部試題 上提取試題到excel中,做為題庫 內部試題 不能通過提取 的方法來直接得到 只能複製到excel 但是複製過來的資料分行顯示在單元格裡,一合併就只顯示第乙個單元格的內容 進一步解決 解決excel 自動篩選時只顯示合併單元格的第一行問題 問題1 有一行資料的行高不能調整,原因是達到...
直接呼叫FTP伺服器中Office文件
www.2ppt.cn word excel powerpoint等office元件均提供了直接呼叫ftp伺服器中文件的功能,它可以像處理本地文件一樣方便地對ftp中支援的文件進行開啟 編輯和儲存等操作。實現的方法是 在 開啟 對話方塊中將 查詢範圍 選擇為 ftp位置 然後雙擊 新增 更改ftp位...