前端框架:a、bootstrap
乘車路線:
考勤制度:
其他:
key words:
1. spark 專為大規模資料處理而設計的快速通用的
計算引擎
。是開源的類hadoop mapreduce的
通用並行框架
,spark,擁有hadoop mapreduce所具有的優點;但不同於mapreduce的是——job中間輸出結果可以儲存在記憶體中,從而不再需要讀寫hdfs,因此spark能更好地適用於資料探勘與機器學習等需要迭代的mapreduce的演算法。
cataloge:
包括大資料
基礎篇(1、2)、儲存與管理(3、4、5、6)、
分析、應用
1. 概述
基礎all:基本概念和應用領域
大資料的4v:volume、variety、velocity、value(數量大、種類多、速度快、價值密度低)
當下三大網際網路技術: 雲計算,大資料,物聯網
其中大資料的很多分析技術都**於雲計算,mapreduce分布式並行處理框架提供了海量資料分析能力。
2. (處理架構)hadoop
3. (分布式檔案系統)hdfs 儲存理
4. (分布式資料庫)hbase
5. nosql資料庫
6. 雲資料庫
7. mapreduce
分析8.
hadoop
9. spark
10.
流計算、圖計算、視覺化 以及大資料在各方面的應用
大資料學習第一天
一.大資料本質 1 資料的儲存 分布式檔案系統 hdfs hadoop distributed file system 2 資料的計算 分布式計算 二.解決大資料儲存 分布式檔案系統 hdfs 於gfs 搭配hdfs,至少3臺機器全分布 三.hadoop出現的前提環境 概念的出現 1.分布式檔案系統...
學習c3和h5第一天
e first letter文字的第乙個單詞或字 如中文 日文 韓文等 e first line 文字第一行 e selection 可改變選中文字的樣式 e before和e after 在e元素內部的開始位置和結束位建立乙個元素,該元素為行內元素,且必須要結合content屬性使用 transl...
大資料學習第一天 Linux篇
在windows平台上安裝vmware虛擬機器,然後在虛擬機上安裝linux。安裝步驟詳見linux安裝文件。編輯配置檔案,新增修改以下內容 vi etc sysconfig network scripts ifcfg eth0 按i 進入文字編輯模式,出現游標,左下角會出現insert,即可以編輯...