今天要處理兩個excel。兩個迴圈巢狀驗證重複性。所以寫了幾個函式來處理20億次的資料量。
一。把excel讀出來,儲存為json。利用phpexcel外掛程式:
<?phpheader("content-type:text/html;charset=utf-8");
$dir=dirname(__file__);//
找到當前指令碼所在路徑
require
$dir."/phpexcel/phpexcel/iofactory.php";//
引入讀取excel的類檔案
$filename=$dir."/o.xls";
$filetype=phpexcel_iofactory::identify($filename);//
自動獲取檔案的型別提供給phpexcel用
$objreader=phpexcel_iofactory::createreader($filetype);//
獲取檔案讀取操作物件
$sheetname=array("sheet1");
$objreader->setloadsheetsonly($sheetname);//
只載入指定的sheet
$objphpexcel=$objreader->load($filename);//
載入檔案
/**$sheetcount=$objphpexcel->getsheetcount();//獲取excel檔案裡有多少個sheet
for($i=0;$i<$sheetcount;$i++)*
*/$i=0;
foreach($objphpexcel->getworksheetiterator() as
$sheet)
$da = array
();
foreach($row->getcelliterator() as
$cell)
$d = $da
; }
}$dd =json_encode($d
);touch('o.html');
file_put_contents('o.html', $dd
);echo "成功";
二、把弄好的陣列,在儲存為execl。但是直接操作excel,會比較慢,所儲存為csv
<?php$filenamew ="dd.html";//
讀取出來的json
$json_sw = file_get_contents($filenamew
);$data = json_decode($json_sw
);$filename = "33"; //
儲存的檔名
header("content-type: text/csv");
header("content-disposition: attachment; filename=.csv");
header("pragma: no-cache");
header("expires: 0");
outputcsv(
$data
);
function outputcsv($data
) fputcsv(
$outputbuffer, $val
); }
fclose($outputbuffer
); }
?>
python 處理Excel資料
環境配置及可實現操作 注 datanitro作為外掛程式使用需依託軟體本身。參考 2 使用xlrd讀取 可以檢測是否已安裝了xlrd,用import命令 沒有安裝的進行安裝xlrd 安裝成功後,讀取檔案 import xlrd 引入模組 開啟檔案,獲取excel檔案的workbook 工作簿 物件 ...
pandas處理excel資料
import pandas as pd f pd.read excel name.xlsx sheet name 檢視有重複的行 re row f.duplicated 去除重複行資料 drop duplicates subset 列名 keep firsrt inplace true 函式是刪除d...
PHP 匯入excel資料
之前發過使用phpexcel將資料匯出到excel檔案的方法,本篇文章主要介紹下如何使用phpexcel將excel檔案匯入到資料庫的方法。下面首先說一下本次匯入的excel檔案的資料格式,截圖如下 下面是將該excel檔案的資料匯入到資料庫的具體 檢視 列印 01 02require once c...