答:散点图用于显示关系。 对于 相关性 ,散点图有助于显示两个变量之间线性关系的强度。 对于 回归 ,散点图常常会添加拟合线。 在质量控制中,散点图常常可以包含规格限或参考线。
答:对于那些变量之间存在密切关系,但是这些关系又不像数学公式和物理公式那样能够精确表达的,散点图是一种很好的图形工具。 但是在分析过程中需要注意,这两个变量之间的相关性并不等同于确定的因果关系,也可能需要考虑其他的影响因素。
答:散点图可以提供三类关键信息:(1)变量之间是否存在数量关联趋势;(2)如果存在关联趋势,是线性还是非线性的;(3)观察是否有存在离群值,从而分析这些离群值对建模分析的影响。 通过观察散点图上数据点的分布情况,我们可以推断出变量间的相关性。 如果变量之间不存在相互关系,那么在散点图上就会表现为随机分布的离散的点,如果存在某种相关性,那么大部分的数据点就会相对密集并以某种趋势呈现。 数据的相关关系主要分为:正相关(两个变量值同时增长)、负相关(一个变量值增加另一个变量值下降)、不相关、线性相关、指数相关等,表现在散点图上的大致分布如右图所示。 那些离点集群较远的点我们称为离群点或者异常点 (Outliers)。
答:散点图应用场景 散点图通常用于显示和比较数值,不光可以显示趋势,还能显示数据集群的形状,以及在数据云团中各数据点的关系。 常见的是身高和体重的数据