2018/09/24
資料分析:匯入資料
資料格式:
先修改csv檔案內容的部分格式。
- 正在執行 (錯誤)
訊息
錯誤 0xc02020a1: 資料流任務 1: 資料轉換失敗。列「寄投位址」的資料轉換返回狀態值 4 和狀態文字「文字被截斷,或者乙個或多個字元在目標**頁中沒有匹配項。」。
(sql server 匯入和匯出嚮導)
錯誤 0xc020902a: 資料流任務 1: 「輸出列「寄投位址」(42)」由於發生截斷而失敗,而且針對「輸出列「寄投位址」(42)」的截斷行處理設定指定截斷時出錯。在指定元件的指定物件上出現截斷錯誤。
(sql server 匯入和匯出嚮導)
錯誤 0xc0202092: 資料流任務 1: 處理檔案「d:\wj\three\工坊\no1\2023年招生錄取資料.csv」的資料行 15 時出錯。
(sql server 匯入和匯出嚮導)
錯誤 0xc0047038: 資料流任務 1: ssis 錯誤** dts_e_primeoutputfailed。元件「源 - 2023年招生錄取資料_csv」(1) 的 primeoutput 方法返回了錯誤** 0xc0202092。管道引擎呼叫 primeoutput() 時該元件返回了乙個失敗**。雖然該失敗**只與該元件有關,但這個錯誤是致命的,管道已停止執行。可能在此之前已經發出錯誤訊息,提供了有關失敗的詳細資訊。
(sql server 匯入和匯出嚮導)
平面檔案源->下一步
視覺化模板:
2018/09/25
資料分析:
1、學生分布情況:
#學院分布:
select count(學號) as num,所在學院
from dbo.stu_data
group by 所在學院;
# 政治面貌分布
select count(學號) as num,政治面貌
from dbo.stu_data
group by 政治面貌;
# 少數民族top10:
select top 10 count(學號) as num,民族
from dbo.stu_data
group by 民族
order by num desc;
#生源地分布:省市,
with stu_data as(
select 學號,case when charindex('市',寄投位址,0)!=0
then substring(寄投位址,0,charindex('市',寄投位址,0)+1)
else ''
end as ds
from dbo.stu_data)
select count(學號) as num,ds
from stu_data
where ds!='' group by ds order by num desc;
省;with stu_data as(
select case when charindex('省',寄投位址,0)!=0
then substring(寄投位址,0,charindex('省',寄投位址,0)+1)
else ''
end as ds
from dbo.stu_data)
select distinct ds
from stu_data
where ds!='';
top10:
with stu_data as(
select 學號,case when charindex('市',寄投位址,0)!=0
then substring(寄投位址,0,charindex('市',寄投位址,0)+1)
else ''
end as ds
from dbo.stu_data)
select top 10 count(學號) as num , ds
from stu_data
where ds!=''
group by ds order by num desc;
機器學習基礎 資料分析
1 問題定義 2 資料獲取 3 資料預處理 4 資料分析與建模 5 資料視覺化及資料報告的撰寫 貢獻度分析又稱帕累託分析,它的原理是帕累託法則又稱2 8定律。即累積效應達80 的前幾個因素。用統計指針對定量資料進行統計描述,常從集中趨勢和離中趨勢兩個方面進行分析。1 集中趨勢度量 均值 中位數 眾數...
資料分析基礎
import numpy as npimport pandas aspd import scipy import matplotlib.pyplot asplt 資料匯入 df pd.read csv r encoding gbk print df.head 前五行 print df.tail 最後...
基礎的資料分析
什麼是資料分析?資料分析是指用適當的統計分析對收集來的大量資料進行分析,提取有用資訊和形成結論而對資料加以詳細研究和概括總結的過程。在實用中,資料分析可幫助人們作出判斷,以便採取適當行動。資料分析的目的是什麼?資料分析的目的是把隱沒在一大批看來雜亂無章的資料中的資訊集中 萃取和提煉出來,以找出所研究...