在论文中应该如何解释p=1以及可以选定其作为最优模型?

avatar
关注

代码:

DATA:

FILE IS C:\Users\hp\Desktop\LPA.dat;

VARIABLE:

MISSING ARE ALL (-99);

NAMES ARE NUM ql bql bh pg;

USEVARIABLES ARE QL BQL BH PG;

CLASSES = c (5) ; ! 设定潜类别个数,从1个类别开始,依次增加;

ANALYSIS : TYPE = MIXTURE ;

MITERATIONS=5000

STARTS = 1000 250; ! 避免局部最大化解,增加随机起始值数

LRTSTARTS= 0 0 500 200;

OUTPUT: TECH11 TECH14;

SAVEDATA: FILE = zc5.txt;

Save = cprob ; ! 保存后验分类概率

Plot: ! 通过绘图命令 可以获得描述性统计图和条件概 示意图

type is plot3 ;

series = QL BQL BH PG ( * );

比书里多的两行代码是因为下面的报错,修改后报错就没有了。ps.不管有没有这行代码tech11结果基本不变

WARNING: OF THE 5 BOOTSTRAP DRAWS, 4 DRAWS HAD BOTH A SMALLER LRT VALUE THAN THE

OBSERVED LRT VALUE AND NOT A REPLICATED BEST LOGLIKELIHOOD VALUE FOR THE 5-CLASS MODEL.

THIS MEANS THAT THE P-VALUE MAY NOT BE TRUSTWORTHY DUE TO LOCAL MAXIMA.

INCREASE THE NUMBER OF RANDOM STARTS USING THE LRTSTARTS OPTION.

tech11结果:TECHNICAL 11 OUTPUT

TECHNICAL 11 OUTPUT

Random Starts Specifications for the k-1 Class Analysis Model

Number of initial stage random starts 20

Number of final stage optimizations 4

VUONG-LO-MENDELL-RUBIN LIKELIHOOD RATIO TEST FOR 4 (H0) VERSUS 5 CLASSES

H0 Loglikelihood Value -9690.979

2 Times the Loglikelihood Difference 11603.859

Difference in the Number of Parameters 6

Mean 156127.952

Standard Deviation 221672.534

P-Value 1.0000

LO-MENDELL-RUBIN ADJUSTED LRT TEST

Value 11393.281

P-Value 1.0000

tech14结果

TECHNICAL 14 OUTPUT

Random Starts Specifications for the k-1 Class Analysis Model

Number of initial stage random starts 20

Number of final stage optimizations 4

Random Starts Specification for the k-1 Class Model for Generated Data

Number of initial stage random starts 0

Number of final stage optimizations for the

initial stage random starts 0

Random Starts Specification for the k Class Model for Generated Data

Number of initial stage random starts 1000

Number of final stage optimizations 500

Number of bootstrap draws requested Varies

PARAMETRIC BOOTSTRAPPED LIKELIHOOD RATIO TEST FOR 4 (H0) VERSUS 5 CLASSES

H0 Loglikelihood Value -9690.979

2 Times the Loglikelihood Difference 11603.859

Difference in the Number of Parameters 6

Approximate P-Value 0.0000

Successful Bootstrap Draws 5

请问为什么p值会等于1,5分类模型除了tech11结果之外其他指标和理论解释性都很好,是否可以接受其作为最优模型,如果可以在论文中应该如何解释p=1以及可以选定其作为最优模型?

感谢各位大佬!

发布于江苏阅读 992

全部回复

discusser-avatar

用弹弓打你家玻璃的Jp

· 山东

在您的分析中,p值等于1可能是由以下几个原因造成的:1. 模型过于复杂,参数过多导致过拟合问题。5个潜类别的模型可能过于复杂,难以从数据中准确地估计所有参数。这会导致似然比检验结果不可靠。2. 样本量不足。如果样本量较小,难以从数据中准确地估计模型参数,这也会导致p值偏高。3. 数值收敛问题。有时候模型难以收敛到全局最优解,导致似然比检验结果不可靠。增加随机起始值和迭代次数可能会有帮助。即使p值等于1,但如果其他指标(如AIC/BIC、分类准确性等)表明5个潜类别模型相对更优,您也可以考虑选择5类模型作为最终模型。在论文中,您可以解释如下:1. 介绍您进行了5个潜类别模型的分析,并报告了各项指标的结果。指出虽然似然比检验结果显示p=1,不支持增加类别数,但其他指标(列出具体指标)表明5类模型相对更优。2. 讨论上述可能导致p值偏高的原因,如模型复杂度、样本量等因素。指出尽管似然比检验不显著,但基于整体的模型评估指标,您认为5类模型更适合解释数据。3. 解释选择5类模型作为最终模型的理论依据和实际意义,说明这一模型能更好地捕捉数据的潜在结构。总之,在论文中要客观地呈现所有模型评估指标,并针对p=1的结果提供合理解释,阐述您选择5类模型作为最优模型的依据。这样可以说服读者接受您的分析结果。

亮了(0)
回复
discusser-avatar

用弹弓打你家玻璃的Jp

· 山东

在您的问题中,p值等于1表明在Lo-Mendell-Rubin调整后的似然比检验和Vuoung-Lo-Mendell-Rubin似然比检验中,5类模型与4类模型比较时,没有统计显著的差异,表明增加一个类别并没有带来模型拟合的显著提升。这通常意味着从统计的角度,没有足够的证据表明5类模型比4类模型更优。然而,统计检验的结果并非是评价模型唯一的标准。实际应用中,模型选择可以考虑多个方面的因素:1. **理论指导**: 模型是否有好的理论基础支持。2. **解释性**: 5类模型是否在实际应用中提供更深入的洞见和更有效的解释性。3. **其他拟合指标**: 如信息准则(AIC、BIC等),这些可以帮助判断模型的复杂度和拟合度。在论文中解释p=1的情况和为何选择5分类模型作为最优模型,可以按以下步骤进行:1. **说明p值含义**:首先明确指出p值=1表示在当前的样本和选择的检验中,增加额外一个类别(从4类到5类)没有带来统计学上的显著改进。2. **强调模型的解释性和理论基础**:解释为什么在您的研究领域或具体应用中,5类模型提供了更合理或更符合理论的分类方式。3. **提及其他拟合优良性指标**:可以引入AIC、BIC等其他统计指标来辅助说明5类模型虽然统计检验不显著,但从模型信息量和复杂度平衡的角度是优于4类模型的。4. **举例验证**:如果可能,提供实际数据应用中5类模型比4类模型更有效的案例。通过上述步骤,您可以全面而合理地在论文中论述为什么选择5分类模型作为最优模型,即使在某些统计测试中这一模型似乎并不显著优越。这种方法不仅仅局限于模型的统计显著性,而是综合评估其理论和实际应用价值。

亮了(0)
回复