一. 讀學生課程分數檔案chapter4-data01.txt,建立dataframe。
1.生成「表頭」
2.生成「表中的記錄」
3.把「表頭」和「表中的記錄」拼裝在一起
用dataframe的操作或sql語句完成以下資料分析要求,並和用rdd操作的實現進行對比:
總共有多少學生?
總共開設了哪些課程?
每個學生選修了多少門課?
每門課程有多少個學生選?
每門課程大於95分的學生人數?
tom選修了幾門課?每門課多少分?
tom的成績按分數大小排序。
tom的平均分
求每門課的選修人數及平均分,精確到2位小數。
每門課的不及格人數,通過率
結果視覺化。
一. 讀學生課程分數檔案chapter4-data01.txt,建立dataframe。
1.生成「表頭」
2.生成「表中的記錄」
3.把「表頭」和「表中的記錄」拼裝在一起
用dataframe的操作或sql語句完成以下資料分析要求,並和用rdd操作的實現進行對比:
總共有多少學生?
總共開設了哪些課程?
每個學生選修了多少門課?
每門課程有多少個學生選?
每門課程大於95分的學生人數?
tom選修了幾門課?每門課多少分?
tom的成績按分數大小排序。
tom的平均分
求每門課的選修人數及平均分,精確到2位小數。
每門課的不及格人數,通過率
結果視覺化。
08 學生課程分數的Spark SQL分析
1.用dataframe的操作或sql語句完成以下資料分析要求 2.總共有多少學生?3.開設了多少門課程?4.每個學生選修了多少門課?5.每門課程有多少個學生選?6.tom選修了幾門課?每門課多少分?7.tom的成績按分數大小排序。8.tom的平均分。9.每個分數 5分。10.求每門課的選修人數及所...
08 案例 學生與課程統計
下面這種資料結構,節選了幾條資料 aaron,operatingsystem,100 aaron,python,50 aaron,computernetwork,30 aaron,software,94 abbott,database,18 abbott,python,82 abbott,compu...
mysql建立 學生表 課程表 分數表 教師表
drop table if exists db school student create table student sno varchar 20 sname varchar 50 primary key sno engine innodb default charset utf8 drop ta...