今天做的是企業發票異常分析中:
zzsfp錶可通過
xf_id
或者gf_id
與nsrxx
中的nsr_id
進行關聯,分離出銷項發票表和進項發票表
最終成功分離出進項發票表和銷項發票表:
步驟如下:
首先建立兩個表:
create table xxfpb1(
hydm string,
xf_id string,
djzclx_dm string,
kydjrq string,
xgrq string,
label string,
fp_nid string,
je double,
se double,
jshj double,
kpyf string,
kprq string,
zfbz string
)row format delimited fields terminated by ',';
create table jxfpb1(
hydm string,
gf_id string,
djzclx_dm string,
kydjrq string,
xgrq string,
label string,
fp_nid string,
je double,
se double,
jshj double,
kpyf string,
kprq string,
zfbz string
)row format delimited fields terminated by ',';
分離語句:
insert into jxfpb1 select t2.nsr_id,t3.gf_id,t2.djzclx_dm,
t2.kydjrq,t2.xgrq,t2.label,t3.fp_nid,t3.je,t3.se,t3.jshj,t3.kpyf,t3.kprq,t3.zfbz from nsrxx t2,zzsfp t3 where t3.gf_id=t2.hydm;
insert into xxfpb1 select t2.nsr_id,t3.gf_id,t2.djzclx_dm,
t2.kydjrq,t2.xgrq,t2.label,t3.fp_nid,t3.je,t3.se,t3.jshj,t3.kpyf,t3.kprq,t3.zfbz from nsrxx t2,zzsfp t3 where t3.xf_id=t2.hydm;
表資料:
這樣就成功將進項發票表和銷項發票表進行了分離。
企業發票異常分析 分離進項與銷項
今天做的是企業發票異常分析中 zzsfp錶可通過xf id或者gf id與nsrxx中的nsr id進行關聯,分離出銷項發票表和進項發票表 最終成功分離出進項發票表和銷項發票表 步驟如下 首先建立兩個表 create table xxfpb1 hydm string,xf id string,djz...
企業發票異常分析 匯入,清洗
今天做了企業發票異常分析的作業成功地將資料匯入到hive資料倉當中,並對資料進行了初步的清洗 流程如下 一 將三個樣表檔案中的資料匯入hive資料倉儲中 先建三個表 create table xxfpb hydm string,xf id string,djzclx dm string,kydjrq...
發票資料分析1
題目 1 資料組成 1 增值稅發票資料,檔名zzsfp 2 發票對應貨物明細資料,檔名zzsfp hwmx 3 企業資訊,檔名nsrxx 2 資料字段說明 1 zzsfp表字典 字段含義 資料型別 備註fp nid 發票id string 發票唯一標識 xf id 銷方識別號 string 企業唯一...