当前位置: 首页 > news >正文

西安网约车哪个平台最好厦门seo排名优化

西安网约车哪个平台最好,厦门seo排名优化,网站推广流程,新野企业网站建设前言: 大部分时候我们都是观察多个X与一个Y之间的相关性(多对一),那如果是多个X与多个Y的相关性该如何分析相关性呢? 你可能会说我把y一个一个拿出来,有多少个y做多少次相关性分析不就行了吗?…

前言:

大部分时候我们都是观察多个X与一个Y之间的相关性(多对一),那如果是多个X与多个Y的相关性该如何分析相关性呢?

你可能会说我把y一个一个拿出来,有多少个y做多少次相关性分析不就行了吗?

答案是:当然不行,这样Y内部的相关性不就被你扼杀在摇篮之中了嘛。

有一种方法可以,它就是典型关联分析(Canonical Correlation Analysis,以下简称CCA),是最常用的挖掘数据关联关系的算法之一。

举个栗子:我们拿到两组数据,第一组是人身高和体重的数据,第二组是对应的跑步能力和跳远能力的数据。那么我们能不能说这两组数据是相关的呢?CCA就可以帮助我们分析这个问题。

一、CCA概述

咱们先回忆一下相关系数:

 它可以很好的帮我们分析一维数据的相关性,但是对于高维数据就不能直接使用了。

咱们开始推广一下:CCA使用的方法是将多维的X和Y都用线性变换为1维的X'和Y'(降维),然后再使用相关系数来看X'和Y'的相关性。

二、CCA的算法思想

用于高维或者多维的数据,我们一般会想到投影追踪法。

上面我们提到CCA是将高维的两组数据分别降维到1维,然后用相关系数分析相关性。但是有一个问题是,降维的标准是如何选择的呢?回想下主成分分析PCA,降维的原则是投影方差最大;再回想下线性判别分析LDA,降维的原则是同类的投影方差小,异类间的投影方差大。对于我们的CCA,它选择的投影标准是降维到1维后,两组数据的相关系数最大。

这样我们的目的就明确了,就是想要使X'和Y'的相关性达到最大。

假设我们的数据集是X和Y,令:

即我们想找到a、b使corr(X',Y')达到最大;

计算其二间的相关系数为:

这里我们可以联想到分式线性规划问题,采用的办法就是令D(X')=D(Y')=1,转化为求解a、b使cov(X',Y')最大;

再引入拉格朗日乘数法(具体推理过程在应用多元统计分析第四版朱建平书上的162页)

注:找到第一对(a1,b1)再继续找第二对的时候,要注意它与第一对之间的信息冗余,最好是找到与之正交的,这样才能保证两组变量内部的相关性没有被破坏。最多可以找到两组维数中的最小值那么多对(a,b)。(与主成分相似)

http://www.wooajung.com/news/34345.html

相关文章:

  • 常州酒店网站建设百度搜索引擎推广怎么弄
  • 网站定制设计服务需要使用的技术深圳关键词自动排名
  • 网上做网站怎么赚钱吗企业网站建设服务
  • 重庆建设工程招标投标网班级优化大师功能介绍
  • 重庆seo薪酬水平济宁seo推广
  • 野马视觉传媒网站建设成都网站建设创新互联
  • 基层网站建设存在困难站长素材网
  • 在线设计装修的网站微信管理系统登录
  • 文章分享网站模版河北seo公司
  • 做羞羞的事的视频网站长沙网站推广seo
  • 怎么做网站转盘seo入门课程
  • 做网站都用到哪些软件宣城网站seo
  • 做网站的人月营销案例网站
  • 高端网网站建设个人开发app可以上架吗
  • 手机怎做网站磁力bt种子搜索
  • 成都seo网站开发免费seo排名网站
  • 做邀请函的网站江苏seo外包
  • 自己怎么做外贸网站空间百度移动权重
  • 企业建设网站公司有哪些免费的行情网站app
  • 猎头公司电话南宁正规的seo费用
  • 北京建设规划委员会网站seo营销推广多少钱
  • 南通装饰网站建设网页设计与制作代码成品
  • 做网站哪家公司好苏州全国防疫大数据平台
  • 北京网站建设公司资讯自己做网站
  • 怎么做国际网站949公社招聘信息
  • 苏州汇聚人电子科技有限公司如何优化搜索引擎的搜索功能
  • 扬州做机床公司网站百度的特点和优势
  • 免费虚拟主机vps陕西seo推广
  • 网站日记在哪里看产品宣传方案
  • 供应链金融网站开发seo快速优化文章排名