本週任務:
1.python基礎的準備
本課程擬採用python做為機器演算法應用的實現語言,所以請確保:
1)安裝好python開發環境, pycharm 或 anaconda等都可以,按個人習慣喜好。
2)基本庫的安裝,如numpy、pandas、scipy、matplotlib
3)具備一定的python程式設計技能,如果不熟悉,可選擇乙個教程進行學習,python簡單好上手,資源也很豐富。
菜鳥教程 python 3 教程
廖雪峰的官方** python3
1)p4 python基礎
2)p1 機器學習概論
建議大家邊看邊做筆記,記錄要點及所在時間點,以便有必要的時候回看。學習筆記也是作業的一部分。
3.作業要求:
1)貼上python環境及pip list截圖,了解一下大家的準備情況。暫不具備開發條件的請說明原因及打算。
①python環境
②pip list:基本庫
都已經安裝,如numpy、pandas、scipy、matplotlib
什麼是機器學習在p1-5分鐘的描述:
python基礎:
p4-5分27
秒安裝庫教程
3)什麼是機器學習,有哪些分類?結合案例,寫出你的理解。
解析:什麼是機器學習?機器學習是人工智慧的乙個分支。我們使用計算機設計乙個系統,使它能夠根據提供的訓練資料按照一定的方式來學習;隨著訓練次數的增加,該系統可以在效能上不斷學習和改進;通過引數優化的學習模型,能夠用於**相關問題的輸出。機器學習有哪些分類?機器學習按照學習形式進行分類,可分為監督學習、無監督學習、半監督學習、強化學習等。區別在於,監督學習需要提供標註的樣本集,無監督學習不需要提供標註的樣本集,半監督學習需要提供少量標註的樣本,而強化學習需要反饋機制。
案例:機器學習已經「無處不在」,應用遍及人工智慧的各個領域,包括資料探勘、計算機視覺、自然語言處理、語音和手寫識別、生物特徵識別、搜尋引擎、醫學診斷、信用卡欺詐檢測、**市場分析、汽車自動駕駛、軍事決策等。
①異常檢測
異常是指某個資料物件由於測量、收集或自然變異等原因變得不同於正常的資料物件的場景,找出異常的過程,稱為異常檢測。根據異常的特徵,可以將異常分為以下三類:點異常、上下文異常、集合異常。異常檢測的訓練樣本都是非異常樣本,假設這些樣本的特徵服從高斯分布,在此基礎上估計出乙個概率模型,用該模型估計待測樣本屬於非異常樣本的可能性。異常檢測步驟包括資料準備、資料分組、異常評估、異常輸出等步驟。
②使用者畫像
③廣告點選率預估
網際網路廣告是網際網路公司主要的盈利手段,網際網路廣告交易的雙方是廣告主和**。為自己的產品投放廣告並為廣告付費;**是有流量的公司,如各大門戶**、各種論壇,它們提供廣告的展示平台,並收取廣告費。廣告點選率(click through rate,ctr)是指廣告的點選到達率,即廣告的實際點選次數除以廣告的展現量。在實際應用中,我們從廣告的海量歷史展現點選日誌中提取訓練樣本,構建特徵並訓練ctr模型,評估各方面因素對點選率的影響。當有新的廣告位請求到達時,就可以用訓練好的模型,根據廣告交易平台傳過來的相關特徵預估這次展示中各個廣告的點選概率,結合廣告出價計算得到的廣告點選收益,從而選出收益最高的廣告向廣告交易平台出價。
④企業徵信大資料應用
徵信是指為信用活動提供信用資訊服務,通過依法採集、整理、儲存、加工企業、事業單位等組織的信用資訊和個人的信用資訊,並提供給資訊使用者。徵信是由徵信機構、資訊提供方、資訊使用方、資訊主體四部分組成,綜合起來,形成了乙個整體的徵信行業的產業鏈。徵信機構向資訊提供方採集徵信相關資料,資訊使用方獲得資訊主體的授權以後,可以向徵信機構索取該資訊主體的徵信資料,從徵信機構獲得徵信產品,針對企業來說,是由該企業的各種維度資料構成的徵信報告。
⑤智慧型交通大資料應用
智慧型交通大資料應用是以物聯網、雲計算、大資料等新一代資訊科技,結合人工智慧、機器學習、資料探勘、交通科學等理論與工具,建立起的一套交通運輸領域全面感知、深度融合、主動服務、科學決策的動態實時資訊服務體系。基於人工智慧和大資料技術的疊加效應,結合交通行業的專家知識庫建立交通資料模型,解決城市交通問題,是交通大資料應用的首要任務。交通大資料模型主要分為城市人群時空圖譜、交通執行狀況感知與分析、交通專項數位化運營和監管、交通安全分析與預警等幾大類。
機器學習入門篇 感知器
1.機器學習的基本概念 三種主要的學習方式 監督學習 使用有類標的訓練資料構建模型,即在訓練過程中,所有的資料都是知道它的類別的。通過構建的這個模型對未來的資料進行 在監督學習的下面,又可以分為分類 利用分類對類標進行 以及回歸 使用回歸 連續輸出值 無監督學習 在沒有已知輸出變數 分類問題中是資料...
機器學習入門篇 梯度下降法
梯度下降法的作用是求到一種方案,使得擬合過程中的損失函式最小 結果可能只為區域性最優值 除此之外還有最小二乘法等方法。關於此方法詳細的闡述參見 這裡 梯度下降法初始點的選取分為隨機選取初值和自動求取初值兩種方法。梯度下降法有兩種具體的實現方法 1.批量梯度下降法 每次向梯度的反方向移動 梯度為函式增...
Postman學習入門篇
postman學習入門篇 document json schema monitor mock 1.document 2.monitor 3.mock 注意 基於postman的monitor只能監聽公共的介面,不能監聽本地和私有介面,因為監聽伺服器在postman公有雲上 文獻選自 1.postma...