1.什麼是資料分析?
資料的獲取、清洗、轉換、建模
2.分類與回歸(分類是有監督的,有標籤)
應用:信用卡申請人風險評估,**公司業務增長量、**房價
原理:分類-將資料對映到預先定義的群或者類,演算法要求基於資料屬性值來定義類別,把具有某些特徵的資料項對映到給定的某個類別上
回歸-用屬性的歷史資料**未來趨勢,演算法首先假設一些已知型別函式可以擬合目標資料,然後某種誤差分析確定乙個與目標資料擬合程度最好的函式
區別:分類模型採用離散**值,回歸模型採用連續**值
3.聚類(無監督的學習,沒有標籤)
應用:根據症狀歸納特定疾病,發現信用卡高階使用者,根據上網行為對客戶分群從而進行精確營銷
原理:沒有給定劃分類的情況下,根據資訊相似度進行資訊聚類。聚類的輸入是一組未被標記的資料,根據樣本特徵的距離或相似度進行劃分,劃分的原則是保持最大的組內相似性和最小的組間相似性。
4.時序模型
應用:下季度的商品銷量或者庫存是多少?明天用電多少
原理:描述基於時間或者其他的序列經常發生的規律或者趨勢,並對其建模,和回歸一樣,用已知資料**未來的資料,但是這些資料的區別是變數所處時間不同。重點考察資料之間在時間維度上的相似性。
5.機器學習的基本框架
第一步:定義一系列函式,找一系列的模型
第二步:定義乙個標準,看哪個模型好
第三步:在一組模型中找最好的模型
6.金融量化分析
金融,對現有資源
金融量化分析
是股份公司發給出資人的一種憑證,的持有者就是股份公司的股東。上市 ipo 企業通過 交易所公開向社會增發 以募集資金 的作用 的分類 按上市地區分類 市場的構成 影響股價的因素 買賣 a股 交易日 周一到周五 非法定節假日和交易所休市日 漲停 跌停限制 購買方式 市價單 限價單 金叉 短期 上穿長期...
python金融量化分析學習
雙 分析 針對茅台 1 使用tushare包獲取歷史 資料 import numpy as np import pandas as pd import matplotlib.pyplot as plt import tushare as ts df ts.get k data 600519 star...
量化分析入門
量化分析是乙個充滿魔力的詞彙。前段時間淘了兩本書,簡單研究一下。乙個是雅虎平台的資料。from pandas datareader import data as dt 獲取中國平安的日線 資料 start date 2020 01 01 end date 2020 03 20 zgpa dt.dat...