關於Logistic Regression的疑問

2022-04-10 01:57:29 字數 906 閱讀 5747

1. 應用場景:首先要明確的是,logistic regression是用來分類的;

與stanford的公開課進行模擬,在該課程中所舉的例子是根據訓練集中房屋的各種feature(area,location等)和**來**測試集中的房屋**,

那麼利用logistic regression就是來**一種值域為[0,1]的label,如房屋****的概率p。若p>=0.5,則將其歸為**;若p<0.5則將其歸為不**。

如你要根據資料來**房價是否會**來決定是否現在買房,那麼logistic regression很適合你的選擇,因為你care的是房價是否會**,而不是具體某個樓盤的房價會是多少。

2. 機率(odds):乙個事件的機率(odds)是指該事件發生的概率與該事情不發生的概率的比值。

對數機率(log odds):log(odds)

設該事件發生的概率為p,則其對數機率為:

logit(p) = ln(p/1-p) = w*x 解得

p = exp(w*x)/ (1 + exp(w*x))

這樣我們就可以根據歷史資料來得到房屋****的概率了,很神奇。

3. 我的問題:

(1).  為什麼能夠想到機率和對數機率?

(2).  直接用線性回歸的方法去估計概率會產生什麼樣的後果?

即令: p = w*x。 檢視了網上其他的一些理解認為: 不同的feature值相差的會比較大,如乙個以100,乙個是1,資料沒有歸一化,這樣會使**效果不好;但是我認為這樣可以用w來調整下就可以了,如對於值為100的feature,w=0.01, 值為1的feature,w=1;這樣好像就可以實現資料歸一化了啊。

看了這個 之後,對為什麼用線性回歸不能很好的實現分類有了一點模糊的概念,但還是對

這個logistic function對事件概率的對映原理不是很理解,求大神指點!

關於程式關於世界

首先,在學了1年多的軟體設計的基礎上,問下自己 程式是什麼?業務需求是什麼?程式有什麼用?什麼是演算法?什麼是資料庫?或許每個人的理解不同,會給出不同的答案。那麼自己的理解 程式是乙個讓計算機工作的流程,在程式寫好之後,計算機就會按照,程式設計師定義好流程在執行。其實很多時候,乙個程式的好壞,在於乙...

關於血液關於軟體

1 自然沉降法 將血袋垂直吊掛於4 2 冰箱內,使紅細胞自然下沉1 3d,或將血袋呈70 80 角立於冰箱,需用時,用一次性分漿器分出血漿,制得濃縮紅細胞。2 洗滌法 一般用生理鹽水反覆洗滌3 6次。經洗滌的紅細胞,除白細胞和血小板減少外,血漿蛋白也極少,紅細胞中殘存的血漿蛋白含量約為原總蛋白的1 ...

關於冷漠,關於愛情

我不知道為什麼今天又莫名其妙開始思考愛情這件事,隨之就解決了我一直無法面對冷漠這件事 被冷漠是我始終無法消化的一件事,每當遇見冷漠時,我總會覺得就像一團火把自己燒得面目全非,但對方卻毫無傷害。但我突然懂了,遇到冷漠時,體面的離開即可 在乎你的人一定會在你離開後,找到你跟你解釋為什麼 連解釋都來不及,...