def
get_sparksession
: conf =
(sparkconf(
).setmaster(
"yarn").
set(
"spark.executor.memory"
,"2g").
set(
'hive.exec.dynamic.partition'
,'true').
set(
'spark.sql.autobroadcastjointhreshold'
,'-1').
set(
'hive.exec.dynamic.partition.mode'
,'nostrick').
set(
'hive.exec.max.dynamic.partitions'
,'100000').
set(
'hive.exec.max.dynamic.partitions.pernode'
,'100000').
set(
"spark.port.maxretries"
,"100"))
spark = sparksession.builder.config(conf=conf)
.enablehivesupport(
).getorcreate(
)# sparksession 是 spark sql 的入口,使用 dataset 或者 datafram 編寫 spark sql 應用的時候,第乙個要建立的物件就是 sparksession。
# builder 是 sparksession 的構造器。 通過 builder, 可以新增各種配置。
引數參考:
Spark常用引數解釋及建議值
spark常用引數解釋及建議值 spark的預設配置檔案位於堡壘機上的這個位置 spark conf dir spark defaults.conf,使用者可以自行檢視和理解。需要注意的是,預設值優先順序最低,使用者如果提交任務時或者 裡明確指定配置,則以使用者配置為先。使用者再理解引數含義的基礎上...
cp命令「 d」引數解釋及例項
d 若原始檔為連線檔案杜屬性,則複製連線檔案屬性而非檔案本身。例如 1 root ubuntu tmp cp s bashrc bashrc slink 建立乙個快捷方式 root ubuntu tmp cp l bashrc bashrc hlink 建立乙個硬連線 root ubuntu tmp...
vimrc 配置及引數解釋
使用vim 編輯乙個檔案時,檔案內容的展現方式和 vimrc 的設定有關。在 etc vim vimrc 中有系統關於vim的一些的配置。對於系統中的每個使用者user,在 home user vimrc 中含有自己的vim 配置資訊 如果沒有這個配置檔案可以自己建立,它是乙個隱藏檔案,可以提供 l...