通過py檔案將檔案中的資料匯入到hive遇見的問題

因需要通過任務的方式執行將文字的資料匯入到hive資料庫中。所以考慮每次的任務通過命令執行py檔案的方式來實現定時匯入檔案到hive資料庫中。所以先做了乙個測試，但是出行一些問題，現記錄下來，供以後檢視。

測試指令碼如下：

#create hive table

spark.sql("use oracledb ")

spark.sql("create table if not exists t_lnt_basic_cardinfo_kf (lcn string, is_time string,is_type string,is_area string,card_type string,purse_type string,card_mark string) using hive")

spark.sql("insert into table t_lnt_basic_cardinfo_st select lcn,is_time, is_type, is_area,card_type ,purse_type,card_mark from t_cardinfo_st ")

儲存檔名：cardinfo.py

執行：python3 cardinfo.py 或者spark-submit cardinof.py

出現問題：

1.執行spark.sql("use oracledb")指令碼的時候，出現:

org.apache.spark.sql.catalyst.analysis.nosuchdatabaseexception: database 'oracledb' not found;

的錯誤提示。

將指令碼拷貝到pyspark的命令模式，所有指令碼執行正常。

解決方法：

在開頭的地方引用hive的支援，具體如下，新增粗體部分。

通過py檔案將檔案中的資料匯入到hive遇見的問題

通過sqlldr將txt檔案匯入oracle資料庫

將csv檔案中的資料匯入MongoDB

將py檔案編譯為pyc檔案

通過py檔案將檔案中的資料匯入到hive遇見的問題

通過sqlldr將txt檔案匯入oracle資料庫

將csv檔案中的資料匯入MongoDB

將py檔案編譯為pyc檔案

相關推薦