8 SparkSQL綜合作業

2022-10-11 07:15:07 字數 1937 閱讀 6254

0. 建立rdd,並轉換為dataframe;scm持久化;建立spark.sql臨時表等預處理:

總共有多少學生?

rdd:

dataframe:

spark.sql:

總共開設了多少門課程?

rdd:

dataframe:

spark.sql:

每個學生選修了多少門課?

rdd:

dataframe:

spark.sql:

每門課程有多少個學生選?

rdd:

dataframe:

spark.sql:

每門課程》95分的學生人數

rdd:

dataframe:

spark.sql:

課程'python'有多少個100分?

rdd:

dataframe:

spark.sql:

tom選修了幾門課?每門課多少分?

rdd:

dataframe:

spark.sql:

tom的成績按分數大小排序。

rdd:

dataframe:

spark.sql:

tom選修了哪幾門課?

rdd:

dataframe:

spark.sql:

tom的平均分。

rdd:

dataframe:

spark.sql:

'operatingsystem'不及格人數

rdd:

dataframe:

spark.sql:

'operatingsystem'平均分

rdd:

dataframe:

spark.sql:

'operatingsystem'90分以上人數

rdd:

dataframe:

spark.sql:

'operatingsystem'前3名

rdd:

dataframe:

spark.sql:

每個分數按比例+20平時分。

rdd:

dataframe:

spark.sql:

求每門課的平均分

rdd:

dataframe:

spark.sql:

選修了7門課的有多少個學生?

rdd:

dataframe:

spark.sql:

每門課大於95分的學生數

rdd:

dataframe:

spark.sql:

每門課的選修人數、平均分、不及格人數、通過率

rdd:

dataframe:

spark.sql:

優秀、良好、通過和不合格各有多少人?

rdd:

dataframe:

spark.sql:

同時選修了datastructure和 database 的學生

rdd:

dataframe:

spark.sql:

選修了datastructure 但沒有選修 database 的學生

rdd:

dataframe:

spark.sql:

選修課程數少於3門的同學

rdd:

dataframe:

spark.sql:

選修6門及以上課程數的同學

rdd:

dataframe:

spark.sql:

查詢平均成績大於等於60分的姓名和平均成績

rdd:

dataframe:

spark.sql:

找出平均分最高的10位同學

rdd:

dataframe:

spark.sql:

SparkSQL實戰8 綜合實戰完成日誌分析4

建立一張表 create table day video traffics topn stat day varchar 8 not null,cms id bigint 10 not null,traffics bigint 20 not null,primary key day,cms id 建立...

python綜合作業要求

至少要完成內容 分析每年不同班級平均成績情況 不同年份總體平均成績情況 不同性別學生成績情況,並用一定圖表展示。分析集美大學2015 2018年間不同省份在本一批的平均分數,柱狀圖展示排名前10的省份,分析福建省這3年各批次成績情況,並 2019年錄取成績 資料不夠,請繼續前往集美大學招生辦獲取更多...

5 陣列綜合 8

5 陣列綜合 8 時間限制 1 s 記憶體限制 8192 kb accept 79 submit 177 提交 討論版 描述把n個數字中最小的數字和最大的數字交換,其他數字的位置保持不變,輸出變化後的n個數字。只會有乙個最大的數和乙個最小的數。輸入只有一組案例。乙個正整數n,然後是n個整數。輸出把n...