文字資料的批量處理在第一篇部落格「dataframe中的字串處理」中有提到,簡單回顧一下,需要先將dataframe中一列文字提取出來,然後使用下標的方式訪問每乙個元素。今天在學習的時候學到了另一種方法,如下:
假設我們要對一列文字資料做乙個簡單的情感分析,並把生成的數值作為新的一列新增在原本資料集之後。首先定義乙個函式:
def
get_sentiments
(text)
: s = snownlp(text)
return s.sentiments
然後:
data[
"sentiment"
]= data.complaints.
(get_sentiments)
#sentiment即為新生成的一列,dataframe可以直接用這樣的方式生成新列;
#complaints是我們的文字列。
通過這樣的方式也完成了遍歷的作用,比起第一種方法要更加簡單便捷。
但是要注意的是做之前需要先進行資料清洗,確保文字列沒有空值存在哦,不然就會報錯的。
python處理文字資料
處理文字資料,主要是通過seris的str訪問。遇到nan時不做任何處理,保留結果為nan,遇到數字全部處理為nan。str是seris的方法,dataframe不能直接使用,但是通過索引選擇dataframe中的某一行或者某一列,結果為seris,然後就可以使用了。例如定義乙個seris和data...
MySQL批量匯出 匯入文字資料
首先要在 mysql 中建立對應的資料表,如可取表名為 stu。格式好的文字資料放在乙個 txt檔案 中,每行包含乙個記錄,並且列的順序必須和資料庫 的列次序相同,且各列之間用 特定的分隔符 分隔開。假如格式好的文字資料放在d盤下的 stu.txt檔案中 各列之間的分隔符為tab,那麼匯入資料可以如...
mysql批量匯出 匯入文字資料
mysql 常用的insert語句 insert into test code no coupon price get mobile get order code code get time code use order id is coupon get goods info id values t...