一、安裝spark
二、python程式設計練習:英文文字的詞頻統計
# 1匯入模組# 匯入字串模組
import
string
# 2讀取檔案,並分詞
list_dict ={} # 建立乙個空字典,放詞頻與單詞,無序排列
data = # 建立乙個空列表,放詞頻與單詞,有序:從多到少
f = open('
zhb.txt
', '
r', encoding="
utf-8
") # 開啟檔案
content =f.read() # 讀取檔案
f.close() # 關閉檔案
content = content.replace('
-', '
') # 連字元—用空格代替
words = content.split() # 字串按空格分割--分詞
# 迭代處理:將字典變列表,存入資料
for i in
range(len(words)):
words[i] = words[i].strip(string
.punctuation) # 去掉標點符號,去掉首尾
words[i] =words[i].lower() # 統一大小寫
if words[i] in
list_dict: # 統計詞頻與單詞
list_dict[words[i]] = list_dict[words[i]] + 1
# 不是第一次
else
: list_dict[words[i]] = 1
# 第一次
# print(list_dict) # 列印字典(詞頻與單詞,無序)
# 遍歷字典
for key, value in
list_dict.items(): # 遍歷字典
temp =[value, key] # 變數,變數值
data.sort(reverse=true) # 排序
print(data) # 列印列表(詞頻與單詞,有序,從多到少)file2.close()
第二次作業
execise02 1.查詢85年以後出生的學生姓名 性別和出生日期 2.列表顯示所有可能的學生選課組合 學號 課程號 3.查詢1 2 4班中陳姓同學的資訊 4.查詢所有及格的學生姓名 所選課程名及所得分數 5.統計各門課程的及格人數 課程編號 課程名 及格人數 6.統計各門課程的總人數 及格人數和...
第二次作業
第一題 p1 1 遞迴寫法,效率低 include 1.寫乙個函式返回引數值為1的個數 比如 15 0000 1111 4個1 程式原型 int count one bits unsigned int value int fuc int x else return 0 void mainp1 p1 ...
第二次作業
檔名稱 516.cpp 作 者 闕文榮 完成日期 2016 年 3 月 11 日 版 本 號 v1.1 對任務及求解方法的描述部分 用while語句控制輸出 輸入描述 略 問題描述 現在北京有一套房子,200萬,假設房價每年 10 乙個軟體工程師每年固定能賺40萬。他想買這套房子,多大的 率能夠忍受...