维数灾难，怎样理解curse of dimensionality

本文目录一览

1，怎样理解curse of dimensionality
2，什么是维数灾
3，数据降维过程中应当解决的基本问题包括什么
4，怎么理解 cpa算法维数约简
5，什么叫模拟前端哪位大侠知道
6，核函数的方法原理

1，怎样理解curse of dimensionality

Curse of Dimensionality 专业：维数灾难通常是指在涉及到向量的计算的问题中，随着维数的增加，计算量呈指数倍增长的一种现象。维数灾难在很多学科中都可以碰到，比如动态规划，模式识别等。

course 吧？course of dimensionality 应该是几何学课程

怎样理解curse of dimensionality

2，什么是维数灾

分都不给，我是学运筹学的,告诉你,在动态规划上就有维数灾难,还有就是时间和空间方面的,就是不告诉你

bu dong

可以参考一些关于数据挖掘的教科书,大致的意思应该是：对于高维数据，会存在欧式距离都差不多的情况（可以证明的），也就是所有点都差不多远近。这样很多给予距离的算法都没意义了。反正很深奥,最好自己买书看!

是动态规划中如果用LINGO软件求解时发现所设的变量有几万至几十万个，从而求解相当麻烦，这时就产生了维数灾

什么是维数灾

3，数据降维过程中应当解决的基本问题包括什么

据降维，又称为维数约简。顾名思义，就是降低数据的维数。数据降维，一方面可以解决“维数灾难”，缓解“信息丰富、知识贫乏”现状，降低复杂度；另一方面可以更好地认识和理解数据。截止到目前，数据降维的方法很多。从不同的角度入手可以有着不同的分类，主要分类方法有根据数据的特性可以划分为线性降维和非线性降维，根据是否考虑和利用数据的监督信息可以划分为无监督降维、有监督降维和半监督降维，根据保持数据的结构可以划分为全局保持降维、局部保持降维和全局与局部保持一致降维等。总之，数据降维意义重大，数据降维方法众多，很多时候需要根据特定问题选用合适的数据降维方法。

数据降维过程中应当解决的基本问题包括什么

4，怎么理解 cpa算法维数约简

在科学研究中，我们常常要对数据进行处理，而这些数据通常位于一个高维空间中，例如当处理一个256*256 的图像序列时，我们需要将其拉成一个向量，这样，我们就得到了65536维的数据，如果直接对这些数据进行处理，会有以下问题：首先，会出现所谓的“维数灾难”问题，巨大的计算量将使我们无法忍受；其次，这些数据通常没有反映出数据的本质特征，如果直接对他们进行处理，不会得到理想的结果。所以，通常我们需要首先对数据进行维数约简，然后对约简后的数据进行处理。当然要保证约简后的数据特征能反映甚至更能揭示原数据的本质特征。通常，我们进行数据维数约简主要是基于以下目的：1、压缩数据以减少存储量2、去除噪声的影响3、从数据中提取特征以便进行分类4、将数据投影到低维可视空间，以便于看清数据的分布对付高维数据问题基本的方法就是维数约简，即将n 维数据约简成m(M<<N)维数据，并能保持原有数据集的完整性，在m 上进行数据挖掘不仅效率更高，且挖掘出来的结果与原有数据集所获得结果基本一致。分析现有的数据挖掘模型，用于数据维数约简的基本策略归纳起来有两种：一种是从有关变量中消除无关、弱相关和冗余的维，寻找一个变量子集来构建模型。换句话说就是在所有特征中选择最优代表性的特征，称为特征选择。另一种特征提取，即通过对原始特征进行某种操作获取有意义的投影。也就是把n 个原始变量变换为m 个变量，在m上进行后续操作。

5，什么叫模拟前端哪位大侠知道

模数转换前的电路，主要是小信号放大，均衡功能。

维数灾难（英语：curse of dimensionality，又名维度的詛咒）是一个最早由理查德·贝尔曼(richard e. bellman)在考虑动态优化问题时首次提出来的术语[1][2]，用来描述当（数学）空间维度增加时，分析和组织高维空间（通常有成百上千维），因体积指数增加而遇到各种问题场景。这样的难题在低维空间中不会遇到，如物理空间通常只用三维来建模。举例来说，100个平均分布的点能把一个单位区间以每个点距离不超过0.01采样；而当维度增加到10后，如果以相邻点距离不超过0.01小方格采样一单位超正方体，则需要1020 个采样点:所以，这个10维的超正方体也可以说是比单位区间大1018倍。(这个是richard bellman所举的例子) 在很多领域中，如采样、组合数学、机器学习和数据挖掘都有提及到这个名字的现象。这些问题的共同特色是当维数提高时，空间的体积提高太快，因而可用数据变得很稀疏。稀疏性对于任何要求有统计学意义的方法而言都是一个问题，为了获得在统计学上正确并且有可靠的结果，用来支撑这一结果所需要的数据量通常随着维数的提高而呈指数级增长。而且，在组织和搜索数据时也有赖于检测对象区域，这些区域中的对象通过相似度属性而形成分组。然而在高维空间中，所有的数据都很稀疏，从很多角度看都不相似，因而平常使用的数据组织策略变得极其低效。 “维数灾难”通常是用来作为不要处理高维数据的无力借口。然而，学术界一直都对其有兴趣，而且在继续研究。另一方面，也由于本征维度的存在，其概念是指任意低维数据空间可简单地通过增加空余（如复制）或随机维将其转换至更高维空间中，相反地，许多高维空间中的数据集也可削减至低维空间数据，而不必丢失重要信息。这一点也通过众多降维方法的有效性反映出来，如应用广泛的主成分分析方法。针对距离函数和最近邻搜索，当前的研究也表明除非其中存在太多不相关的维度，带有维数灾难特色的数据集依然可以处理，因为相关维度实际上可使得许多问题（如聚类分析）变得更加容易。

6，核函数的方法原理

方法原理根据模式识别理论，低维空间线性不可分的模式通过非线性映射到高维特征空间则可能实现线性可分，但是如果直接采用这种技术在高维空间进行分类或回归，则存在确定非线性映射函数的形式和参数、特征空间维数等问题，而最大的障碍则是在高维特征空间运算时存在的"维数灾难"。采用核函数技术可以有效地解决这样问题。设x,z∈X,X属于R(n)空间,非线性函数Φ实现输入空间X到特征空间F的映射,其中F属于R(m),n<<m。根据核函数技术有:K(x,z) =<Φ(x),Φ(z) > (1)其中:<, >为内积,K(x,z)为核函数。从式(1)可以看出，核函数将m维高维空间的内积运算转化为n维低维输入空间的核函数计算，从而巧妙地解决了在高维特征空间中计算的"维数灾难"等问题，从而为在高维特征空间解决复杂的分类或回归问题奠定了理论基础。

根据模式识别理论，低维空间线性不可分的模式通过非线性映射到高维特征空间则可能实现线性可分，但是如果直接采用这种技术在高维空间进行分类或回归，则存在确定非线性映射函数的形式和参数、特征空间维数等问题，而最大的障碍则是在高维特征空间运算时存在的“维数灾难”。采用核函数技术可以有效地解决这样问题。设x,z∈X,X属于R（n）空间,非线性函数Φ实现输入空间X到特征空间F的映射,其中F属于R（m）,n<<m。根据核函数技术有：K(x,z) =<Φ(x),Φ(z) > (1)其中：<, >为内积,K(x,z)为核函数。从式(1)可以看出，核函数将m维高维空间的内积运算转化为n维低维输入空间的核函数计算，从而巧妙地解决了在高维特征空间中计算的“维数灾难”等问题，从而为在高维特征空间解决复杂的分类或回归问题奠定了理论基础。

核函数包括线性核函数、多项式核函数、高斯核函数等，其中高斯核函数最常用，可以将数据映射到无穷维，也叫做径向基函数（Radial Basis Function 简称 RBF），是某种沿径向对称的标量函数。通常定义为空间中任一点x到某一中心xc之间欧氏距离的单调函数 , 可记作 k（||x-xc||），其作用往往是局部的 , 即当x远离xc时函数取值很小。方法原理：根据模式识别理论，低维空间线性不可分的模式通过非线性映射到高维特征空间则可能实现线性可分，但是如果直接采用这种技术在高维空间进行分类或回归，则存在确定非线性映射函数的形式和参数、特征空间维数等问题，而最大的障碍则是在高维特征空间运算时存在的“维数灾难”。采用核函数技术可以有效地解决这样问题。设x,z∈X,X属于R（n）空间,非线性函数Φ实现输入空间X到特征空间F的映射,其中F属于 R（m）,n<<m。根据核函数技术有：K(x,z) =<Φ(x),Φ(z) > (1) 其中：<, >为内积,K(x,z)为核函数。从式(1)可以看出，核函数将m维高维空间的内积运算转化为n维低维输入空间的核函数计算，从而巧妙地解决了在高维特征空间中计算的“维数灾难”等问题，从而为在高维特征空间解决复杂的分类或回归问题奠定了理论基础。

文章TAG：维数灾难怎样理解curse of dimensionality