clob裡儲存的文字格式是
[name
李大哥age
20…]
或者[暫無登記]
業務要求:要查詢出來clob的內容,並且找到裡面有個文字是 '暫無登記』的資料。
涉及到的操作:
去除換行:select replace(欄位名,chr(10),』』) from dual;
去除回車:select replace(欄位名,chr(13),』』) from dual;
去掉左右空格:select trim(欄位名) from dual;
判斷colb的長度:select dbms_lob.getlength(欄位名) from 表名;
轉換colb為字元:select dbms_lob.substr(欄位名,4000) from 表名;
期間可能報錯:
60502:緩衝區太小,我的解決辦法是把查詢的from後面的表的資料縮減,先把一些限制條件加入子表,(因為基表很大,但是業務資料只有幾百條,用幾個條件先篩選一部分資料)解決了這個問題。
64203:clob中格式符號太多,需要只摘取文字,就可以解決這個問題。
最後將以上提到的都組合在一起就是
select trim(replace(replace(t1.欄位名,chr(10),』』),chr(13),』』))
from (select 欄位名 from table t where t.id = ? and dbms_lob.getlength(t.欄位名) <6 and ) t1
where dbms_lob.substr(t1.欄位名,4000) = 『暫無登記』;
(這裡其實可以不用子查詢也是可以的)
shuf處理文字
在cu上面看到了乙個帖子,帖子的內容即要求是 請教一下,我需要頻繁不斷地聯接9臺伺服器執行某個相同的服務。但我有特殊的要求 1。每次都按不同的順序來訪問這9臺伺服器。例如 135987642,下次又是亂序依次訪問。2。希望這9臺伺服器的主機名通過乙個shell 指令碼整合不需要另外起乙個txt文件來...
文字預處理
常見預處理步驟,預處理通常包括四個步驟 讀入文字 分詞建立字典,將每個詞對映到乙個唯一的索引 index 將文字從詞的序列轉換為索引的序列,方便輸入模型 現有的工具可以很好地進行分詞,我們在這裡簡單介紹其中的兩個 spacy和nltk。text mr.chen doesn t agree with ...
文字預處理
本文章內容主要學習文字預處理的基本步驟及實現。1 讀入文字 2 分詞 3 建立詞典,將每乙個詞對映到乙個唯一的索引 4 將文字從詞的序列轉換為索引的序列,方便輸入模型 此處用一部英文 即h.g.well的time machine,作為示例,展示文字預處理的具體過程。def read time mac...