1.排程引數
2.在dataworks上使用pyodps
3.left join
4.shard表示對乙個topic進行資料傳輸的並發信道,每個shard會有對應的id。每個shard會有多種狀態: opening - 啟動中,active - 啟動完成可服務。每個shard啟用以後會占用一定的服務端資源,建議按需申請shard數量。shard可以進行合併和**,當資料量增大時,可以採用**shard來增加資料通道,提高資料寫入的併發量,當資料量減小時,應該合併shard減少伺服器資源浪費。例如**在雙11期間,資料量驟增,這個時候每個shard的寫入壓力過大,便可以增加shard提高寫入效率,在雙11過後,資料量明顯降低,則需要合併shard。
5.decimal(precision,scale)
10進製精確數字型別。
如果不指定以上兩個引數,則預設為decimal(38,18)
。
6.日期函式
jsoup中文參考文件資料
jsoup中文參考文件資料 解析和遍歷乙個html文件 解析乙個html字串 解析乙個body片斷 從乙個url載入乙個document物件 根據乙個檔案載入document物件 使用dom方法來遍歷乙個document物件 使用選擇器語法來查詢元素 從元素集合抽取屬性 文字和html內容 url處...
Debug參考文件
本來想自己整理一下linux除錯過程中常用的有哪一些的除錯工具,無意中發現了乙個 類似於開源書籍。中已經對於常用的一些除錯命令,做了很好的總結。這些命令主要包括 ps,top,vmstat,iostat,strace,free等,還包含了一些其它的常規命令 gdb,ldd,nm,lsof,reade...
中颱及資料中臺
資料諮詢公司thoughtworks首席諮詢師王建給出的10字定義 企業級的能力復用平台 最早由阿里2015年提出的 大中台,小前台 戰略中延伸出來的概念,靈感 於馬爸爸15年拜訪了supercell公司。企業前方市場與企業內部支撐的衝突。變化無序穩定有序 前台與後台的衝突。快速響應,低成本試錯紮實...