模擬 我要清晰的Unicode轉碼表

2021-06-06 08:33:32 字數 1699 閱讀 2186

我要清晰的unicode轉碼表

description

據檔案歷史記錄,wx曾經在2023年2月研究過unicode,並嘗試了shift-jis、gb2312、unicode的相互轉換問題。找資料當然要上官方**,於是從unicode.org上down下了官方編碼對映表,不過看似這個表有一些問題,下面就請你處理一下。文件中,#之後為注釋部分,可能有空行或多於的空格,我所需要的是正規的**轉換部分。

比如shift-jis到unicode的轉換檔案正文內容舉例如下(所有編碼都有注釋):

0x7d	0x007d	# right curly bracket

0x7e 0x203e # overline

0x8140 0x3000 # ideographic space

0x8141 0x3001 # ideographic comma

前面是shift-jis編碼,中間是unicode編碼,後面是注釋,以tab(ascii編號9)分隔,注意不是空格

現在我需要按一些要求轉化成下面的格式:

0x7d	0x007d	right curly bracket

0x7e 0x203e overline

0x8140 0x3000 ideographic space

0x8141 0x3001 ideographic comma

具體要求如下,去除整行的注釋和空行,對於正規轉碼表部分格式如下:(原碼)tab(目標碼)tab(描述),其中描述去除#和左右多於空格,中間有超過乙個的空格也合併,除字母空格外沒有其他字元,單詞首字母大寫。各個單位仍然以tab分隔(好看,處理也方便)。特別的,如果描述為比如:「0xe686 0x8ade # 」(其實這種東西很多,)那麼就只輸出編碼。

input

輸入內容如描述所述,以eof結束,每行不超過100個字元,每行或者為空行,或者以#開始或者以0開始

output

輸出內容如描述所述

sample input

original

transformed

#	any comments or problems, contact #

0x20 0x0020 # space

0x9d57 0x6294 # 0x9d58 0x62d7 #

sample output

original

transformed

0x20	0x0020	space

0x9d57 0x6294

0x9d58 0x62d7

模擬題都是考細心和耐心的啊,這個好像出現就不能輸出注釋,題意理解錯誤wa兩次啊。

#include#include#include#include#includeusing namespace std;

int main()

printf("%s\t",temp.c_str());

stream>>temp;

printf("%s",temp.c_str());

stream>>temp;

if(temp[0]=='#'&&temp.length()!=1)

cnt="";

if(temp.length()!=0&&temp!="#")

for(int i=0;i>temp;)

{if(temp=="") break;

for(int i=0;i

csp模擬 我的訂書機之戀 樹形結構 雜湊

傳送門 事實上標題給的是兩種做法。正解 乙個合法答案只能是最小答案或者由兩個答案子區間並集構成。否則肯定會叉出去 那就有乙個天然樹形結構,用單調棧維護f r表示右端點r最近的合法答案位置。令r向f r連邊,l向f 連邊。當然,上述連邊是反向的 倍增lca的深度 2就是答案,記得特判兩個點相同的情況。...

轉 Unicode 和 UTF 8 的區別

簡單來說 unicode 是 字符集 utf 8 是 編碼規則 其中 字符集 為每乙個 字元 分配乙個唯一的 id 學名為碼位 碼點 code point 編碼規則 將 碼位 轉換為位元組序列的規則 編碼 解碼 可以理解為 加密 解密 的過程 廣義的 unicode 是乙個標準,定義了乙個字符集以及...

iOS 列印Unicode碼轉中文的解決辦法

在開發中,我們經常會進行列印除錯,但是有時候你會發現列印的內容並不是你想要的,因為它們是unicode碼 入下圖 如何將列印資訊轉成中文呢,下面我給大家提供一種方法。我們一般列印的資訊是陣列資訊和字典資訊,它們的資訊量比較多,與後台互動也多是轉成這兩種資料型別,我們分別建立它們的分類,然後重寫 ns...