第二次作業

2022-10-06 14:36:30 字數 963 閱讀 5748

一、安裝spark

hadoop,jdk基礎壞境的檢查

spark的使用

二、python程式設計練習:英文文字的詞頻統計

import string

list=

dict={}

txt=open('

text.txt

','r

').read().lower() #讀取檔案

for ch in

string

.punctuation: #替換標點符號

txt=txt.replace(ch,""

)list=txt.split() #分割文章

for i in

list: #統計詞頻

if i in

dict:

dict[i]+=1

else

: dict[i]=1

dict= sorted(dict.items(),key=lambda d:d[1],reverse=true) #詞頻排序

f = open('

result.txt

','w

') #格式化將結果寫入檔案

for items in

dict:

f.writelines(

'{}--{}

'.format(items[0],items[1]) + '

\n')

執行結果:

第二次作業

execise02 1.查詢85年以後出生的學生姓名 性別和出生日期 2.列表顯示所有可能的學生選課組合 學號 課程號 3.查詢1 2 4班中陳姓同學的資訊 4.查詢所有及格的學生姓名 所選課程名及所得分數 5.統計各門課程的及格人數 課程編號 課程名 及格人數 6.統計各門課程的總人數 及格人數和...

第二次作業

第一題 p1 1 遞迴寫法,效率低 include 1.寫乙個函式返回引數值為1的個數 比如 15 0000 1111 4個1 程式原型 int count one bits unsigned int value int fuc int x else return 0 void mainp1 p1 ...

第二次作業

檔名稱 516.cpp 作 者 闕文榮 完成日期 2016 年 3 月 11 日 版 本 號 v1.1 對任務及求解方法的描述部分 用while語句控制輸出 輸入描述 略 問題描述 現在北京有一套房子,200萬,假設房價每年 10 乙個軟體工程師每年固定能賺40萬。他想買這套房子,多大的 率能夠忍受...