当前位置:首页 > > 正文

分类数据分析中的拟合优度检验?

  • 分类数据分析中的拟合优度检验?
  • 2024-03-29 07:29:06
  • 8

简介知识图谱继续我们的知识总结,本文总结包括:多选题研究、聚类分析研究、权重研究、非参数检验、数据分布。查看本系列之前的文章,可点击下面的链接:论文里的分析方法要用哪一种,SPSSAU告诉你答案论文常用数...

知识图谱

分类数据分析中的拟合优度检验?

继续我们的分类分析知识总结,本文总结包括:多选题研究、数据聚类分析研究、拟合权重研究、优度非参数检验、检验数据分布。分类分析

查看本系列之前的数据文章,可点击下面的拟合链接:论文里的分析方法要用哪一种,SPSSAU告诉你答案论文常用数据分析方法分类总结-2

11. 多选题研究

多选题分析-SPSSAU

多选题分析可分为四种类型包括:多选题、优度单选-多选、检验多选-单选、分类分析多选-多选。数据

“多选题分析”是拟合针对单个多选题的分析方法,可分析多选题各项的优度选择比例情况

“单选-多选”是针对X为单选,Y为多选的检验情况使用的方法,可分析单选和多选题的关系。

“多选-单选”是针对X为多选,Y为单选的情况使用的方法。

“多选-多选”是针对X为多选,Y为多选的情况使用的方法。

12. 聚类分析

聚类分析-SPSSAU

聚类分析以多个研究标题作为基准,对样本对象进行分类。

如果是按样本聚类,则使用SPSSAU的进阶方法模块中的“聚类”功能,系统会自动识别出应该使用K-means聚类算法还是K-prototype聚类算法。

如果是按变量(标题)聚类,此时应该使用分层聚类,并且结合聚类树状图进行综合判定分析。

13. 权重研究

权重研究-SPSSAU

权重研究是用于分析各因素或指标在综合体系中的重要程度,最终构建出权重体系。权重研究有多种方法包括:因子分析、熵值法、AHP层次分析法、TOPSIS、模糊综合评价、灰色关联等。

因子分析:因子分析可将多个题项浓缩成几个概括性指标(因子),然后对新生成的各概括性指标计算权重。

熵值法:熵值法是利用熵值携带的信息计算每个指标的权重,通常可配合因子分析或主成分分析得到一级权重,利用熵值法计算二级权重。

AHP层次分析法:AHP层次分析法是一种主观加客观赋值的计算权重的方法。先通过专家打分构造判断矩阵,然后量化计算每个指标的权重。

TOPSIS法:TOPSIS权重法是一种评价多个样本综合排名的方法,用于比较样本的排名。

模糊综合评价:是通过各指标的评价和权重对评价对象得出一个综合性评价。

灰色关联:灰色关联是一种评价多个指标综合排名的方法,用于判断指标排名。

14. 非参数检验

非参数检验-SPSSAU

非参数检验用于研究定类数据与定量数据之间的关系情况。如果数据不满足正态性或方差不齐,可用非参数检验。

单样本Wilcoxon检验用于检验数据是否与某数字有明显的区别。

如果X的组别为两组,则使用MannWhitney统计量,如果组别超过两组,则应该使用Kruskal-Wallis统计量结果,SPSSAU可自动选择。

如果是配对数据,则使用配对样本Wilcoxon检验

如果要研究多个关联样本的差异情况,可以用多样本Friedman检验。

如果是研究定类数据与定量(等级)数据之间的差异性,还可以使用Ridit分析。

15. 数据分布

数据分布-SPSSAU

判断数据分布是选择正确分析方法的重要前提。

正态性:很多分析方法的使用前提都是要求数据服从正态性,比如线性回归分析、相关分析、方差分析等,可通过正态图、P-P/Q-Q图、正态性检验查看数据正态性。

随机性:游程检验是一种非参数性统计假设的检验方法,可用于分析数据是否为随机。

方差齐性:方差齐检验用于分析不同定类数据组别对定量数据时的波动情况是否一致,即方差齐性。方差齐是方差分析的前提,如果不满足则不能使用方差分析。

Poisson分布:如果要判断数据是否满足Poisson分布,可通过Poisson检验判断或者通过特征进行判断是否基本符合Poisson分布(三个特征即:平稳性、独立性和普通性)

卡方拟合优度检验:卡方拟合优度检验是一种非参数检验方法,其用于研究实际比例情况,是否与预期比例表现一致,但只针对于类别数据。

单样本T检验:单样本T检验用于分析定量数据是否与某个数字有着显著的差异性。

上述分析方法均可在SPSSAU中使用分析,以及相关方法问题可查看SPSSAU帮助手册。

数学建模系列笔记5:综合评价和因子分析

属于。灰色关联度分析是一种多因素统计的方法,它是通过定量描述和比较的方法分析一个系统变化发展的动态,是属于统计概率的范畴的。其基本思想是通过确定的参考序列和若干个比较列之间曲线的变化。

@[toc]

模糊综合评价法使用背景

模糊综合评价法解题步骤

总结与体会

模糊综合评价法的优点:

模糊综合评价法的缺点:

定义:设U是论域,称映射

确定了一个U上的模糊子集 。映射 称为 隶属函数, 称为x对A的隶属程度,简称隶属度。

模糊集合A由隶属函数 唯一确定,故认为二者是等同的。

这里 表示 对模糊集A的隶属程度是 .

模糊集并不再回答“是或不是”的问题,而是对每个对象给一个隶属度,所以与经典集合有本质区别。

模糊集的运算

设A,B是论域U的两个模糊集合,定义:

模糊矩阵

设 ,称R为模糊矩阵。

当 只取0或1时,称R为布尔(Boole)矩阵。当模糊方阵 的对角线上的元素 都为1时,称R为模糊自反矩阵

模糊矩阵的运算

设 都是模糊矩阵,定义

模糊矩阵的合成

设 ,称模糊矩阵

为A与B的合成,其中

层次分析法 Analytic Gierarchy Process, AHP:对一些较为复杂、较为模糊的问题做出决策的简易方法,特别适用于那些难于完全定量分析的问题,是一种简便、灵活而又实用的多准则决策方法。

层次分析法步骤:目标层O、准则层C、方案层P,每层有若干元素,各层元素间的关系用相连的直线表示。通过相互比较确定各准则对目标的权重,及各方案对每一准则的权重。

将上述两组权重进行综合,确定各方案对目标的权重。

成对比较阵和权向量

元素之间两两对比,对比采用相对尺度。设要比较各准则C1,C2,…,Cn对目标O的重要性

正互反矩阵

矩阵 为正互反矩阵,若当矩阵A满足以下特征:

$$1. a_{ i,j}\geq 0\

权向量

考察完全一致的情况

权向量

权向量的选取

Topis全名为逼近于理想解的排序算法(Technique for Order Preference by Similarity to Ideal Solution),是一种适合多指标、多方案决策分析的系统评价方法。通过构造“正理想解”与“负理想解”来对多个决策方案进行排序。

“正理想解”:设想的最好解,它的各个属性值都达到各候选方案中的最好的值。

“负理想解”:设想的最坏解,它的各个属性值都达到各候选方案中的最坏的值。

Topsis法通过计算某一距离与正理想解与负理想解之间的加权欧氏距离,得出该方案与正理想解的接近程度,以此作为评价各方案优劣的依据。

方法背景:

设置较多指标,带来问题:

主成分分析:精简变量、保留原始信息

目标:构造一些综合指标使满足如下条件:

方法步骤

1-4. 主成分理论分析

起源一:寻找潜在变量

因子分析模型是主成分分析的推广。它也是利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。

起源二:综合评价

因子分析

为公共因子,是不可观测的变量, 称为因子载荷阵, 表示第i个变量在第j个因子上的载荷loading, 是特殊因子,是不能被前m个公共因子包含的部分。并且满足 不相关。

公因子需要满足以下要求:

一旦求出A,因子分析将可以处理以下问题:

方差极大旋转

因子分析计算步骤

判别分析方法使用背景

灰色关联分析方法,是根据因素之间发展趋势的相似或相异程度,即“灰色关联度“,作为衡量因素之间关联程度的一种方法。

灰色关联分析基本步骤:

总结与体会

灰色关联分析方法对样本量的多少没有过分的要求,也不需要典型的分布规律,计算量少到甚至可以手算,且不致出现关联度的量化结果与定性分析不一致的情况。

利用熵的概念确定指标权重的方法称为熵值法The Entropy method。其出发点是根据某同一指标观测值之间的差异程度来反映其重要程度,如果各被评价对象的某项指标的数据差异不大,则反映该指标对评价系统所起的作用不大,差异程度越大,该指标对综合评价的影响越大。

熵值法模型

熵值法:一种客观的赋权方法,它利用各指标的熵值所提供的信息量的大小来决定指标权重的方法。

熵值法可以避免各评价指标权重的认为因素干扰,使评价结果更符合实际。但是熵值法不能减少评价指标的维数