資料科學 第 3 章 11 字串處理

2021-09-13 03:40:52 字數 1129 閱讀 8637

檢視了word列的字串長度,平均搜尋詞的長度為8.8,75%是搜尋詞在10個以內,最長的有95個字元

df.word.str.len().describe()

out:

count 2324.000000

mean 8.767642

std 4.695302

min 0.000000

25% 6.000000

50% 8.000000

75% 10.000000

max 95.000000

name: word, dtype: float64

檢視字元大於50個的資料,執行**後只有2條資料。

df[df.word.str.len() > 50]

# 如果想檢視字串長度大於30的資料有多少條,可以用

df[df.word.str.len() > 30].count()

out:

date 15

id 15

word 15

rank1 15

number1 15

url 15

dtype: int64

-- 查詢是否包含某些字元

str.contains

#word列包含『家』字的資料是什麼

df[df.word.str.contains('家')]

還可以用input()的方法,來查詢輸入的字元是否在word列中

就這樣,下節學習時間格式的處理,然後第3章就結束了,拜拜。

第3章 11 字串排序 20分 python

本題要求編寫程式,讀入5個字串,按由小到大的順序輸出。輸入格式 輸入為由空格分隔的5個非空字串,每個字串不包括空格 製表符 換行符等空白字元,長度小於80。輸出格式 按照以下格式輸出排序後的結果 after sorted 每行乙個字串 輸入樣例 red yellow blue green white...

第 11 章 字串

字串是以空字元 0 結尾的 char 型別陣列。有多種方法可以定義字串 字串常量 char 型別陣列 指向 char 的指標。2.1 字串常量 用雙引號括起來的內容稱為字串字面量,也叫做字串常量。雙引號中的字元和編譯器自動加入末尾的 0 字元,都作為字串儲存在記憶體中。字串常量屬於靜態儲存類別,這說...

第3章 13 字串替換 15 分

第3章 13 字串替換 15 分 本題要求編寫程式,將給定字串中的大寫英文本母按以下對應規則替換 原字母對應字母az bycx dw xcyb za輸入在一行中給出乙個不超過80個字元 並以回車結束的字串。輸出在一行中給出替換完成後的字串。only the 11 capital letters ar...