路徑中包含變數的情況:
fw = open('./result/'+date+'migu.singerinfo.txt','w')
filelist = gci('./'+str)
startswith和endswith的用法:
if f.startswith('./'+str+'/a_m-songer_') and f.endswith('txt'):
寫shell指令碼:
#!/bin/bash
today=`date +%y%m%d`
yesterday=`date -d yesterday +%y%m%d`
echo $today
echo $yesterday
mkdir data$yesterday
cd data$yesterday
cd ..
python 1.genmifusinger.py $yesterday
python 2.migusong.py $yesterday
python 3.getrepeat.py $yesterday
python 4.filterepeat.py $yesterday
需要注意的地方:
1、獲取當前日期的方法,`date +%y%m%d`以及獲取昨天以及n天前日期的方法。
2、顯示變數,echo$today
3、給python檔案傳引數的方法——>python 2.migusong.py $yesterday
if [ $# -ne 2 ]; then
usage
exit -1
fistartdate=$1
enddate=$2
while [ $ -le $ ]
do echo $
if [ ! -d "./data$" ]; then
mkdir data$startdate
cd data$startdate
cd ..
fipython 1.genmifusinger.py $startdate
python 2.migusong.py $startdate
python 3.getrepeat.py $startdate
python 4.filterepeat.py $startdate
startdate=`date -d "1 day $" +%y%m%d`
done
需要注意的地方:
1、判斷某路徑中是否存在某資料夾,如果是在當前路徑下判斷,./dictory_path/
2、獲取加一天日期的操作——>current_date= `date -d "1 day $" +%y%m%d`
自學Python資料處理 二 資料解析
資料採用的是 豆瓣讀書top250 的第一頁的資料 codeing utf 8 time 2021 1 2413 52 file booklist.py software pycharm import requests from bs4 import beautifulsoup url 請求資料 h...
Python資料處理之資料視覺化 二
本篇使用資料 口袋妖怪資料集 提取碼s30w import pandas as pd import matplotlib.pyplot as plt import matplotlib.gridspec as gridspec 匯入資料 data pd.read csv data pokemon p...
資料探勘 (二)資料預處理
1.資料質量的三個要素 準確性 完整性 一致性 2.資料預處理的主要任務 資料清理 資料整合 資料歸約 資料變換 資料清理主要 填補缺失的值,光滑雜訊同時識別離群點,並糾正資料的不一致性。通常是乙個兩步的迭代過程,包括偏差檢測和資料變換 注意 在某些情況下,缺失值並不意味著資料有誤。在理想情況下,每...