离散因变量的回归¶
用于受限和定性因变量的回归模型。该模块目前允许估计具有二元 (Logit, Probit)、名义 (MNLogit) 或计数 (Poisson, NegativeBinomial) 数据的模型。
从 0.9 版本开始,这也包括新的计数模型,这些模型在 0.9 中仍然是实验性的,NegativeBinomialP、GeneralizedPoisson 和零膨胀模型,ZeroInflatedPoisson、ZeroInflatedNegativeBinomialP 和 ZeroInflatedGeneralizedPoisson。
请参阅 模块参考 以了解命令和参数。
示例¶
# Load the data from Spector and Mazzeo (1980)
In [1]: import statsmodels.api as sm
In [2]: spector_data = sm.datasets.spector.load_pandas()
In [3]: spector_data.exog = sm.add_constant(spector_data.exog)
# Logit Model
In [4]: logit_mod = sm.Logit(spector_data.endog, spector_data.exog)
In [5]: logit_res = logit_mod.fit()
Optimization terminated successfully.
Current function value: 0.402801
Iterations 7
In [6]: print(logit_res.summary())
Logit Regression Results
==============================================================================
Dep. Variable: GRADE No. Observations: 32
Model: Logit Df Residuals: 28
Method: MLE Df Model: 3
Date: Thu, 03 Oct 2024 Pseudo R-squ.: 0.3740
Time: 16:08:45 Log-Likelihood: -12.890
converged: True LL-Null: -20.592
Covariance Type: nonrobust LLR p-value: 0.001502
==============================================================================
coef std err z P>|z| [0.025 0.975]
------------------------------------------------------------------------------
const -13.0213 4.931 -2.641 0.008 -22.687 -3.356
GPA 2.8261 1.263 2.238 0.025 0.351 5.301
TUCE 0.0952 0.142 0.672 0.501 -0.182 0.373
PSI 2.3787 1.065 2.234 0.025 0.292 4.465
==============================================================================
详细的示例可以在这里找到
技术文档¶
目前所有模型都是通过最大似然估计的,并假设独立同分布误差。
所有离散回归模型都定义相同的方法并遵循相同的结构,这与回归结果类似,但有一些特定于离散模型的方法。此外,其中一些还包含额外的特定于模型的方法和属性。
参考¶
此类模型的通用参考是
A.C. Cameron and P.K. Trivedi. `Regression Analysis of Count Data`.
Cambridge, 1998
G.S. Madalla. `Limited-Dependent and Qualitative Variables in Econometrics`.
Cambridge, 1983.
W. Greene. `Econometric Analysis`. Prentice Hall, 5th. edition. 2003.
模块参考¶
具体的模型类是
|
Logit 模型 |
|
Probit 模型 |
|
多项式 Logit 模型 |
|
泊松模型 |
|
负二项式模型 |
|
广义负二项式 (NB-P) 模型 |
|
广义泊松模型 |
|
泊松零膨胀模型 |
|
零膨胀广义负二项式模型 |
|
零膨胀广义泊松模型 |
|
用于计数数据的障碍模型 |
|
用于计数数据的截断广义负二项式模型 |
|
用于计数数据的截断泊松模型 |
|
将条件逻辑回归模型拟合到分组数据。 |
|
将条件多项式逻辑回归模型拟合到分组数据。 |
|
将条件泊松回归模型拟合到分组数据。 |
用于序数因变量的累积链接模型目前位于 miscmodels 中,因为它子类化了 GenericLikelihoodModel。这将在以后的版本中更改。
|
基于逻辑或正态分布的序数模型 |
具体的类是
|
Logit 模型的结果类 |
|
Probit 模型的结果类 |
|
计数数据的结果类 |
|
多项式数据的结果类 |
|
负二项式 1 和 2 的结果类 |
|
广义泊松的结果类 |
|
零膨胀泊松的结果类 |
|
零膨胀广义负二项式的结果类 |
|
零膨胀广义泊松的结果类 |
|
障碍模型的结果类 |
|
截断泊松的结果类 |
|
截断负二项式的结果类 |
|
|
|
有序模型的结果类 |
DiscreteModel
是所有离散回归模型的超类。估计结果以 DiscreteResults
的子类实例形式返回。每个模型类别,二元、计数和多元,都有其自己的中间级模型和结果类。这些中间类主要是为了方便实现由 DiscreteModel
和 DiscreteResults
定义的方法和属性。
|
离散选择模型的抽象类。 |
|
离散因变量模型的结果类。 |
|
|
|
二元数据的结果类 |
|
|
|
|
|
通用零膨胀模型 |