篩選 中文 文字檔案中的相關漢字,及轉成陣列等

2021-06-04 22:17:43 字數 770 閱讀 8660

require 'jcode'  #utf-8 的漢字相容

$kcode='u'

argv[0]="e:\\bumentxl20120314utf8.txt"

fil1e=file.open(argv[0]).readlines

ni=0

fil1e.each do |elem|

if (   (elem.include?('當代中國') || elem.include?('當代') || elem.include?('當代所') )   )&& (   ! (elem.include?('文獻中心') ) && (   ! (elem.include?('語言所') )  ) && (   ! (elem.include?('民族文學所') )  ) && (   ! (elem.include?('馬研院') )  ) && (   ! (elem.include?('經濟所') )  ) && (   ! (elem.include?('文學所') )  )   ) then

ni=ni+1

print ni

print "\t",", -"

puts elem

endend

#字串轉陣列

i="phpruby".split('p')

i.each do |v|

print v   , '---'              ,"\n"

end#陣列轉字串

sz=['php','ruby','python']

puts sz.join("@")

用 UIWebView 顯示中文文字檔案的若干問題

nsstring path nsbundle mainbundle pathforresource 48 1 oftype txt nsurl url nsurl fileurlwithpath path if url webview loadrequest nsurlrequest request...

Python 中文路徑和中文文字檔案亂碼問題

情景 python首先讀取名為log.txt的文字檔案,其中包含有檔名相對路徑資訊filename.隨後python呼叫shutil.copy2 src,dst 對該filename檔案進行複製操作.由於filename為相對路徑資訊,所以我們需要硬編碼寫入父目錄,假設為 c 源目錄 同時還有目標目...

統計給定文字檔案中漢字的個數

漢字機內碼在計算機的表達方式的描述是,使用二個位元組,每個位元組最高位一位為1.計算機中,補碼第一位是符號位,1 表示為負數,所以 漢字機內碼的每個位元組表示的十進位制數都是負數 所以這題也就可以簡化為輸入字串判斷其中字元轉化為十進位制數是否小於零.注意 漢字是有兩個小於零的字元組成,所以在統計結果...