通常在回归分析时,如果是二分类变量可以直接当做连续性变量进行回归,而多分类时,则需要设置哑变量,即将每个类别转换成0,1的编码来表示,
因此这里我们求相关系数时,也可以采用类似的设置哑变量,
只不过是有几个类别就设置几个哑变量,这也相当于将多分类变量变成了多个0、1编码的二分类变量,然后再直接使用相关分析,
选择所有的哑变量和连续性因变量进行普通的pearson相关,就可以得出每个分类与因变量的相关系数了。
分类变量怎么转换为连续变量
通常在回归分析时,如果是二分类变量可以直接当做连续性变量进行回归,而多分类时,则需要设置哑变量,即将每个类别转换成0,1的编码来表示,
因此这里我们求相关系数时,也可以采用类似的设置哑变量,
只不过是有几个类别就设置几个哑变量,这也相当于将多分类变量变成了多个0、1编码的二分类变量,然后再直接使用相关分析,
选择所有的哑变量和连续性因变量进行普通的pearson相关,就可以得出每个分类与因变量的相关系数了。
应该是不能进行转化的。
连续性的变量可以转化为分类变量,因为这是从高级到低级的数据转化,提供的信息会减少,但是从分类变量转换成连续型变量,是低级到高级的数据转化,不能进行。