最近接手了乙個關於文字處理的專案,資料如下:
depth sp ml1 ml2 cals rt cild r2.5 gr dt bs
1450.125 106.266 0.001 0.002 24.195 2.185 406.685 1.969 10.552 346.144 24.770
1450.250 106.265 0.001 0.002 24.195 2.129 415.175 1.919 10.577 350.513 24.770
1450.375 106.283 0.001 0.002 24.195 2.067 421.774 1.875 10.731 354.600 24.770
1450.500 106.333 0.001 0.002 24.208 2.029 423.681 1.839 10.826 358.675 24.770
1450.625 106.397 0.001 0.002 24.266 2.011 422.446 1.803 10.726 362.464 24.770
第一行是我處理後的列名,具體要求是按列提取資料。可是列不固定,這裡有11列,其他的文字可能是12,13列。按使用者提供的要求列提取資料。
我有兩個想法,第乙個是將資料存到excel表,需要呼叫ole,可能打包的時候也很不方便,此外需要用暫時的excel,用powerbuilder不方便。第二個是用資料視窗處理,列名不固定,應該需要動態的生成乙個表,可是怎麼才能和資料視窗建立連線阿,總共就那麼幾個型別。高手有沒有什麼更好的想法或者是對上面的想法有什麼指點,不吝賜教,謝謝了。
NLP 文字處理的小問題
參考文章 問題 搜狗預料庫的資料型別 編碼格式為 gb18030 這種文字檔案不是標準的xml檔案,沒有根節點。因此要新增根節點使該文字檔案符合xml檔案的規範 可以用xml樹操作對 象,可以用mysql載入xml資料 當資料量極大時不能用windoms開啟記事本手動新增。方法有多種 直接linux...
簡單的文字處理
這一節我們將介紹這幾個命令tr 注意不是tar col,join,paste。實際這一節是上一節關於能實現管道操作的命令的延續,所以我們依然將結合管道來熟悉這些命令的使用。tr 命令可以用來刪除一段文字資訊中的某些文字。或者將其進行轉換。使用方式 tr option set1 set2 常用的選項有...
簡單的文字處理
本文介紹tr 注意不是tar col,join,paste命令。實際上是管道操作命令的延續,所以我們依然將結合管道來熟悉這些命令的使用。tr命令可以用來刪除一段文字資訊中的某些文字,或者將其進行轉換。使用方式 tr option set1 set2 常用的選項有 選項說明 d刪除和set1匹配的字元...