spark官方文件:
yum -y installl lrzsz
1.在hadoop目錄下執行,從本地(windows)上傳user.csv
檔案到虛擬機器2.檢視hdfs目錄
hdfs dfs -ls /
3.遞迴建立目錄
hdfs dfs -mkdir -p /events/users
4.上傳檔案到hdfs
hdfs dfs -put user.csv /events/users
5.在zeepelin中操作(1)錄入資料
(2)檢視表結構
如何使用Python與Mysql進行資料互動
自己的夢想需要你自己去實現 python 在mysql的官網獲取python與mysql的互動手冊mysql官方手冊 pythontodatabase.py import mysql.connector cnx mysql.connector.connect user root password 6...
Zeppelin使用說明
在zeppelin中以筆記本 notebook 的形式組織和管理互動式資料探索任務,乙個筆記本 note 可以包括多個段 paragraph 段是進行資料分析的最小單位,即在段中可以完成資料分析 的編寫以及結果的視覺化檢視。下圖所示筆記本為 應用嚮導 圖中紅框部分為段。在段內,包括段標題 段 編輯區...
如何進行資料同步
建立資料庫的鏈結 create database link dblink test connect to 需要鏈結的資料庫的名字 identified by 密碼 using 這個鏈結的別名 建立物化檢視用於同步資料 create materialized view test test是同步過來的實...