1. 首先我們需要找到資料,很多地方提供了api,比如:
但是這個**不提供空氣質素)
2. 從api獲取資料,使用python,**粘出來:
# -*- coding: utf-8 -*-
import urllib2
import json
from datetime import datetime
import pandas as pd
最終選擇的特徵有:氣溫tempm, **dewptm, 濕度humidity, 風力wspdm, 能見度vism, 氣壓pressurei, 降水precipm
其中,tempm:min max mean, dewptm:min max mean, humidity:humidity, wspdm: min max, vism: mean min max,
pressurei: max min mean, precipm:precipm
目標:fog(霧霾)
def getdata(month,day,meant,meand,humi,maxw,meanv,meanp,preci,fo):
date = datetime(2017, month, day)
print day
f = urllib2.urlopen(target.format(date.strftime('%y%m%d')))
json_string = f.read()
parsed_json = json.loads(json_string)
day = parsed_json['history']['dailysummary']
temp = day[0]['meantempm'] #氣溫情況
dewptm = day[0]['meandewptm'] # **情況
hum = day[0]['humidity'] # 濕度情況
wspdm = day[0]['maxwspdm'] # 風力情況
vism = day[0]['meanvism'] # 能見度情況
press = day[0]['meanpressurei'] # 氣壓情況
prec = day[0]['precipm'] # 降水情況
fog = day[0]['fog'] #霧霾情況
f.close()
if __name__ == '__main__':
meantempm =
meandewptm =
humidity =
maxwspdm =
meanvism =
meanpressurei =
precipm =
f =
for day in range(1,31):
getdata(4, day, meantempm, meandewptm, humidity, maxwspdm, meanvism, meanpressurei, precipm, f)
print meantempm
#head = [u'溫度',u'**',u'濕度',u'風力',u'能見度',u'氣壓',u'降水',u'霧霾']
value = [meantempm, meandewptm, humidity, maxwspdm, meanvism, meanpressurei, precipm, f]
value = list(zip(*value))
dataframe = pd.dataframe(value)
dataframe.to_csv('/users/purixingtei/downloads/output-2.csv', index=false, encoding="utf-8")
特別注意一點就是:不要起csv.py的名!!!
(loading)
機器學習與資料
2001年bank和bill做了這麼乙個實驗 區分容易混淆的詞,如 to,two,too 比如 for breakfast i ate two eggs.他們用了不同的演算法 並繪製了下圖 可以看到,不同演算法得到差不多的效能。但是它們有乙個共同點 隨著資料的增加,演算法效能都在提公升。於是它們得到...
04 機器學習 資料探勘與機器學習導論
簡而言之,資料探勘 data mining 是有組織有目的地收集資料,通過分析資料使之成為資訊,從而在大量資料中尋找潛在規律以形成規則或知識的技術。機器學習可以用來作為資料探勘的一種工具或手段 資料探勘的手段不限於機器學習,譬如還有諸如統計學等眾多方法 但機器學習的應用也遠不止資料探勘,其應用領域非...
機器學習 機器學習資料積累
前面我曾經發帖推薦過網上的一些做 影象處理和計算機視覺的 有料部落格資源,原帖位址 1 首先,是豆瓣上的資料鋪子主頁 因為我個人多是用r來做資料探勘和分析,所以主頁菌的內容很對我的胃口。這個主頁裡有大量用r做資料探勘的內容。我也向博主偷師了很多。儘管主頁菌已經停止更新內容了,但是現有的部分 其實文章...