[編輯]
Tobit模型的形式
Tobit模型的形式如下:
yi = α + βxi + υi (1)
其中υi為隨機(jī)誤差項(xiàng),xi為定量解釋變量。yi為二元選擇變量。此模型由James Tobin 1958年提出,因此得名。如利息稅、機(jī)動(dòng)車(chē)的費(fèi)改稅問(wèn)題等。設(shè)
若是第一種選擇等于1,第二種選擇是0。對(duì)yi取期望,
E(yi) = α + βxi (2)
下面研究yi的分布。因?yàn)閥i只能取兩個(gè)值,0和1,所以yi服從兩點(diǎn)分布。把yi的分布記為,
則:
E(yi) = 1(pi) + 0(1 − pi) = pi (3)
由(2)和(3)式有:
pi = α + βxi (yi的樣本值是0或1,而預(yù)測(cè)值是概率。) (4)
以pi = − 0.2 + 0.05xi 為例,說(shuō)明xi 每增加一個(gè)單位,則采用第一種選擇的概率增加0.05。假設(shè)用這個(gè)模型進(jìn)行預(yù)測(cè),當(dāng)預(yù)測(cè)值落在 [0,1] 區(qū)間之內(nèi)(即xi取值在[4, 24] 之內(nèi))時(shí),則沒(méi)有什么問(wèn)題;但當(dāng)預(yù)測(cè)值落在[0,1] 區(qū)間之外時(shí),則會(huì)暴露出該模型的嚴(yán)重缺點(diǎn)。因?yàn)楦怕实娜≈捣秶?[0,1],所以此時(shí)必須強(qiáng)令預(yù)測(cè)值(概率值)相應(yīng)等于0或1(見(jiàn)下圖)。線性概率模型常寫(xiě)成如下形式,
(5)
然而這樣做是有問(wèn)題的。假設(shè)預(yù)測(cè)某個(gè)事件發(fā)生的概率等于1,但是實(shí)際中該事件可能根本不會(huì)發(fā)生。反之,預(yù)測(cè)某個(gè)事件發(fā)生的概率等于0,但是實(shí)際中該事件卻可能發(fā)生了。雖然估計(jì)過(guò)程是無(wú)偏的,但是由估計(jì)過(guò)程得出的預(yù)測(cè)結(jié)果卻是有偏的。
由于線性概率模型的上述缺點(diǎn),希望能找到一種變換方法,(1)使解釋變量xi所對(duì)應(yīng)的所有預(yù)測(cè)值(概率值)都落在(0,1)之間。(2)同時(shí)對(duì)于所有的xi,當(dāng)xi增加時(shí),希望yi也單調(diào)增加或單調(diào)減少。顯然累積概率分布函數(shù)F(zi) 能滿足這樣的要求。采用累積正態(tài)概率分布函數(shù)的模型稱作Probit模型。用正態(tài)分布的累積概率作為Probit模型的預(yù)測(cè)概率。另外logistic函數(shù)也能滿足這樣的要求。采用logistic函數(shù)的模型稱作logit模型。