您好,欢迎访问三七文档
说明然而这样做是有问题的。假设预测某个事件发生的概率等于1,但是实际中该事件可能根本不会发生。反之,预测某个事件发生的概率等于0,但是实际中该事件却可能发生了。虽然估计过程是无偏的,但是由估计过程得出的预测结果却是有偏的。当预测值落在[0,1]区间之内时,则没有什么问题;但当预测值落在[0,1]区间之外时,则会暴露出该模型的严重缺点。因为概率的取值范围是[0,1],所以此时必须强令预测值(概率值)相应等于0或1由于线性概率模型的上述缺点,希望能找到一种变换方法,(1)使解释变量xi所对应的所有预测值(概率值)都落在(0,1)之间。(2)同时对于所有的xi,当xi增加时,希望yi也单调增加或单调减少。显然累积概率分布函数F(zi)能满足这样的要求。另外logistic函数也能满足这样的要求。•采用累积正态概率分布函数的模型称作Probit模型。•采用logistic函数的模型称作logit模型。logit累积概率分布函数的斜率在pi=0.5时最大,在累积分布两个尾端的斜率逐渐减小。说明相对于pi=0.5附近的解释变量xi的变化对概率的变化影响较大,而相对于pi接近0和1附近的xi值的变化对概率的变化影响较小。logit曲线计算上也比较方便logit模型的一个重要优点是把在[0,1]区间上预测概率的问题转化为在实数轴上预测一个事件发生的机会比问题。在样本中pi是观测不到的。相对于xi的值,只能得到因变量yi取值为0或1的信息。极大似然估计的出发点就是寻找样本观测值最有可能发生条件下的的估计值。从样本看,如果第一种选择发生了n次,第二种选择发生了N-n次。设采取第一种选择的概率是pi。采取第二种选择的概率是(1-pi)。重新将样本数据排列,使前n个观测值为第一种选择,后N-n个观测值为第二种选择(观测值是0,1的,但相应估计的概率却各不相同),则似然函数是核心概念一
本文标题:二值选择模型
链接地址:https://www.777doc.com/doc-5170651 .html