Hive解析json格式字段

2021-10-22 14:10:35 字數 1387 閱讀 7645

新建hive表

create external table asmp.json_test(

id string,

info string

)row format delimited fields

terminated

by'\t'

lines

terminated

by'\n'

location 'hdfs://nameservice1/user/asmp/json_test'

插入資料

1	[,,]

2 [,,

]

處理資料1:

使用到的函式:

#regexp_replace(string initial_string, string pattern, string replacement) 根據正規表示式處理文字格式

第乙個引數為字段,第二個引數為要替換的文字格式,第三個引數為替換後的目標格式,第二第三個引數均使用正則表達。

#split(string str, string pat) 將字串分割

第乙個引數為操作的字串,第二個引數為分割符。

#lateral view explode()

行轉列,將乙個欄位內的內容拆成多行

concat(

)將多個字串合併為乙個

#get_jason_object(column, "$.parameter") 解析json資料

第乙個引數是選擇的字段,第二個引數是json資料中選擇的引數

Hive 解析複雜json格式字段

本篇文章中所使用的方法來自部落格hive中的lateral view 與 explode函式的使用,感謝大佬的分享。一.問題背景 資料來源hive資料表結構如下 其中info欄位的資料型別為string格式的複雜json結構,例如 需求現在需要統計每個id 中info欄位所對應的使用者數量,而最關鍵...

Hive解析json格式資料

本文將介紹兩個使用hive解析json的小demo 1.hadoop hadoop001 jsondata more rating.json 很多資料.hive hwzhdb create table parsejson jsondata string oktime taken 0.146 seco...

HIVE解析json格式資料

id conditions 312 313 第一步 我們可以看到conditions欄位下的json格式資料,是json串裡面套著類似於list結構,我們先取出。get json object conditions,diyitems 取出之後資料是這樣的 第二步 我們把list結構中每個元素拿出來形...