using system;
using system.collections.generic;
using system.componentmodel;
using system.data;
using system.drawing;
using system.linq;
using system.text;
using system.windows.forms;//openfiledialog
using system.io;//文字處理
namespace cuttxt
//瀏覽按鈕的事件
private void bt_browsefile_click(object sender, eventargs e)
}//分割按鈕的事件
private void bt_cutfiles_click(object sender, eventargs e)
else if (tb_linenumber.text == "0")
else
}//得到行數
public int gettxtproperty(string filelocation)
return bb;
}//開始分割
public void cuttxt(string filelocation, int linenumbers)
//開始處理分割
int curline = 0;//工作行
int curpage=0;//當前工作篇
for (int p = 0; p < page-1; p++)//先寫前n篇,最後一篇單獨寫
sw.flush();
sw.close();
curline += setlines;
curpage=p;
"當前索引:" + curline+"當前page值:"+curpage);
}//寫最後一篇
streamwriter sw_last = new streamwriter("xiangjun" + (curpage+1) + ".txt", true, encoding.getencoding("gb2312"));
for (int j = curline; j < filelines; j++)
sw_last.flush();
sw_last.close();
messagebox.show("分割成功!");
}//當設定的行數更改時,記錄其數值
//設定文字框失效事件,在form1.designer.cs中
private void tb_linenumber_lostfocus(object sender, eventargs e)
private void tb_linenumber_textchanged(object sender, eventargs e)
else
}private void linklabel1_linkclicked(object sender, linklabellinkclickedeventargs e)}}
python實現文字分割
文字分割是自然語言理解資料預處理中的重要步驟,本段程式實現的是用 分割文章,並且分割子句單句成行 import re pattern r 正則匹配模式,用 表示至少乙個字元 flags sentence txt with open test.txt r encoding utf 8 as reade...
shell文字分割 擷取 去重方法
aa sdf dslkfjuklsdfjlksjdf aa sdf dslkfjuklsdfjlksjdf bb sdf2 dslkfjuklsdfjlksjdf bb sdf2 dslkfjuklsdfjlksjdf bb sdf2 dslkfjuklsdfjlksjdf bb sdf2 dslk...
文獻筆記 短文本分析
基於稀疏特徵的中文微博短文本聚類方法研究 熊祖濤簡介 目前的主要文字表示模型 vsm,n gram,類短語串,概念模型,圖模型,事件模型 vsm 每個文字由特徵項和對應權重表示 t 1,w1 t2,w2,t n,wn 特徵降維 文件頻率,資訊增益,chi統計量,互資訊,期望交叉熵 特徵權重的計算方法...