技術研究思路以及Spark基礎學習筆記

2021-07-26 21:52:41 字數 1839 閱讀 7202

《養生主》前兩句話指出:

吾生也有涯,而知也無涯。以有涯隨無涯,殆已!

上面這句話說明了時間有限而知識無限的困局,而當代的資訊科技領域令人咂舌的技術更新速度進一步加重了這個問題。

但我並不認同於這句話的後半部分,我們沒有可能學習人類全部的領域,也沒有這個必要,目前在人工智慧正在逐步奪走人類的工作技術是乙個不爭的事實,但這一波技術更新替代的將不僅是低技術含量的工作機會,而且還包括很大一批的高薪酬的純粹的知識型工作崗位,這個是跟以往最大的不同。

好了扯遠了,我只是想說,當今時代重要的不僅僅是之前的經驗和知識積累,更重要的是持續學習的意識和精神,我們還是繼續討論為什麼要研究spark的問題上,持續學習的問題以後在討論。

起因是家人喜歡看開門大吉,但我絕對這個太沒技術含量了,肯定機器做的更好,於是我去網上搜了一下,還真沒找到(好吧,後來我找到了幾個應用,而且好像很早索尼就有類似的功能),於是我就想自己做乙個類似的功能,

目標開發乙個能夠自動識別開門大吉門鈴聲的程式或應用

關聯自己人工智慧是目前的it領域的主流,估計在未來的工作中也會不可避免涉及到,與人工智慧是建立在大量資料訓練的基礎上的,而大資料處理為人工智慧提供了乙個飛躍的框架,因此大資料處理和人工智慧將是這個研究中的兩個核心

結合熱點人工智慧和大資料處理框架,最熱的就是深度學習和spark了,對於人工智慧我還是有一定基礎的,畢竟本科和碩士階段做過相應的研究,但大資料處理框架完全沒有經驗,我做事喜歡先從最難的入手,所以先從spark開始研究

研究思路一般是

基礎調研->理論簡單研究->helloworld->示例程式->理論解惑

這個週期一般要1~2個月

下面按照這個思路開始。

今天偷點懶我把給團隊做的spark介紹

spark的基本流程可以從下圖了解

這裡面有一些基本概念,

了解了這些基本概念我們可以看看第乙個spark helloworld程式了

還有基本關於spark的重量級應用,不能不說

最後

《Spark效能優化技術研究綜述》學習筆記

大資料平台的執行環境由於受到底層硬體 體系結構 作業系統 spark框架本身以及使用者編寫的應用程式等多層次的綜合影響。如果不了解spark底層複雜的執行機制,就找不到效能瓶頸,也就無法優化。使用者的driver程式通過action操作劃分job,有多少個action操作就有多少個job。job通過...

AOP技術研究 引言

1 引言 軟體設計因為引入物件導向思想而逐漸變得豐富起來。一切皆為物件 的精義,使得程式世界所要處理的邏輯簡化,開發者可以用一組物件以及這些物件之間的關係將軟體系統形象地表示出來。而從物件的定義,進而到模組,到元件的定義,利用物件導向思想的封裝 繼承 多型的思想,使得軟體系統開發可以向搭建房屋那樣,...

引擎技術研究之Shader技術

shader 技術屬於 gpu的渲染技術,其相應語言是高階著色器語言 high level shader language 簡稱hlsl hlsl 主要作用為將一些複雜的影象處理快速而又有效率地在顯示卡上完成。在 directx 中有兩種 shader 頂點著色器 vertex shader vs ...