relieff
排名使用ReliefF或RReliefF算法预测的重要性
描述
例子
确定重要的预测因子
加载示例数据。
负载fisheriris
使用10最近的邻居发现的重要预测因子。
[idx、重量]= relieff(量、种类、10)
idx =1×44 3 1 2
重量=1×40.1399 0.1226 0.3590 0.3754
idx
显示了预测数字列出根据他们的排名。第四个因素是最重要的,第二个因素是最重要的。权重
给出了权重值预测的顺序相同。第一个预测的重量为0.1399,第四个预测的重量为0.3754。
排名预测的重要性
加载示例数据。
负载电离层
排名基于重要性的预测使用10最近的邻居。
[idx、重量]= relieff (X, Y, 10);
创建一个酒吧的预测重要性权重。
栏(权重(idx))包含(“预测排名”)ylabel (的预测指标的重要性权重)
选择五大最重要的预测因子。找到这些预测的列X
。
idx (1:5)
ans =1×524日3 8 5 14
的24日列X
是最重要的预测Y
。
确定重要的分类预测
等级分类预测使用relieff
。
加载示例数据。
负载carbig
把分类预测变量制造行业
,模型
,起源
数值,并将它们合并到一个输入矩阵。指定响应变量英里/加仑
。
X = [grp2idx (Mfg) grp2idx(模型)grp2idx(起源)];y = MPG;
找到的排名和权重预测变量使用10最近的邻居和治疗中的数据X
分类。
(idx、重量)= relieff (X, y, 10日“categoricalx”,“上”)
idx =1×31 2 3
重量=1×3-0.0019 0.0501 0.0114
的模型
在预测预测是最重要的英里/加仑
。的制造行业
变量有负重量,表明这不是一个很好的预测英里/加仑
。
输入参数
X
- - - - - -预测数据
数字矩阵
预测数据,指定为一个数字矩阵。每一行的X
对应于一个观察,每一列对应一个变量。
数据类型:单
|双
y
- - - - - -响应数据
数值向量|分类向量|逻辑向量|字符数组|字符串数组|单元阵列的特征向量
响应数据,指定为一个数字矢量,分类向量,逻辑向量,字符数组,字符串数组或单元阵列特征向量。
数据类型:单
|双
|分类
|逻辑
|字符
|字符串
|细胞
k
- - - - - -许多最近的邻居
正整数标量
最近的邻居,指定为一个正整数标量。
数据类型:单
|双
名称-值对的观点
指定可选的逗号分隔条名称,值
参数。的名字
参数名称和吗价值
相应的价值。的名字
必须出现在引号。您可以指定几个名称和值对参数在任何顺序Name1, Value1,…,的家
。
relieff (X, y, 5,“方法”,“分类”、“categoricalx”,“上”)
最近的邻居和指定5对响应变量和预测数据的分类。
“方法”
- - - - - -计算重量的方法
“回归”
|“分类”
计算重量的方法,指定为逗号分隔组成的“方法”
,要么“回归”
或“分类”
。如果y
是数字,“回归”
是默认的方法。否则,“分类”
是默认的。
例子:“方法”、“分类”
“之前”
- - - - - -每个类的先验概率
“经验”
(默认)|“统一”
|数值向量|结构
先验概率为每个类,指定为逗号分隔组成的“之前”
在这个表和一个值。
价值 | 描述 |
---|---|
“经验” |
类类频率的概率确定y 。 |
“统一” |
所有类的概率是相等的。 |
数值向量 | 存在一个值为每一个不同的组名。 |
结构 | 一个结构
|
例子:“前”、“制服”
数据类型:单
|双
|字符
|字符串
|结构体
“更新”
- - - - - -的观测数量计算权重
“所有”
(默认)|正整数标量
数量的观察为计算权重,选择随机指定为逗号分隔组成的“更新”
,要么“所有”
或者一个正整数标量。默认情况下,relieff
使用所有的观察。
例子:“更新”,25岁
数据类型:单
|双
|字符
|字符串
“categoricalx”
- - - - - -分类预测标志
“关闭”
(默认)|“上”
分类预测标志,指定为逗号分隔组成的“categoricalx”
,要么“上”
或“关闭”
。如果您指定“上”
,然后relieff
把所有预测X
分类。否则,它将所有的预测X
作为数字。你不能混合数值和分类预测。
例子:“categoricalx”,“上”
“σ”
- - - - - -距离比例因子
数字积极标量
距离比例因子,指定为逗号分隔组成的“σ”
和一个数字积极标量。为观察我,影响预测体重从其最近的邻居j乘以
。排名(我,j)的位置吗j观察最近的邻居的我th观察,按距离排序。默认值是正
分类(所有最近的邻居都有相同的影响)和50回归。
例子:“σ”,20
数据类型:单
|双
输出参数
提示
算法
ReliefF
ReliefF发现情况的预测因子的权重y
是一个多级分类变量。的预测算法惩罚给邻居同一个类的不同的值,和奖励预测,给邻居不同的值不同的类。
ReliefF首先预测权重集Wj为0。然后,该算法迭代选择一个随机的观察xr,发现k最近的观察,xr对于每个类,和更新,为每一个最近邻x问,所有的预测因子的权重Fj如下:
如果xr和x问是在同一个班,
如果xr和x问分别在不同的班级上课,
Wj我预测的重量吗Fj在我迭代步骤。
pyr这类的先验概率吗xr属于,py问这类的先验概率吗x问属于。
米指定的迭代次数吗
“更新”
。预测的值的差异吗Fj之间的观察xr和x问。让xrj表示的值jth预示观察xr,让xqj表示的值jth预示观察x问。
对于离散Fj,
连续Fj,
d中移动是一个距离函数的形式
的距离比例
在哪里排名(r,问)的位置吗问观察最近的邻居的rth观察,按距离排序。k是最近的邻居的数量,规定
k
。你可以改变指定的缩放“σ”
。
RReliefF
RReliefF与连续y
。也类似于ReliefF, RReliefF惩罚给邻居不同值的预测响应值相同,和奖励预测,给邻居有不同的响应值不同的值。然而,RReliefF使用中间权重来计算最终的指标权重。
给定两个最近的邻居,假设如下:
Wdy是有不同的重量值反应y。
Wdj是有不同的重量值预测Fj。
的重量有不同的响应值和值预测Fj。
RReliefF第一集的权重Wdy,Wdj, ,Wj等于0。然后,该算法迭代选择一个随机的观察xr,发现k最近的观察,xr和更新,为每一个最近的邻居x问,所有的中间权重如下:
的我和我1标表示迭代步数。米指定的迭代次数吗
“更新”
。是连续的值的差异反应y之间的观察xr和x问。让yr表示的响应值的观察xr,让y问表示的响应值的观察x问。
的 和d中移动功能是一样的ReliefF。
RReliefF计算指标权重Wj完全更新后中间的重量。
有关更多信息,请参见[2]。
引用
[1]Kononenko,我。,E. Simec, and M. Robnik-Sikonja. (1997). “Overcoming the myopia of inductive learning algorithms with RELIEFF.” Retrieved from CiteSeerX:https://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.56.4740
[2]Robnik-Sikonja, M。,即Kononenko。(1997)。“一个适应属性评估救援的回归。“从CiteSeerX检索:https://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.34.8381
[3]Robnik-Sikonja, M。,即Kononenko。(2003)。“理论和实证分析ReliefF和RReliefF。”机器学习现年53岁的23 - 69。
介绍了R2010b
MATLAB命令
你点击一个链接对应MATLAB命令:
运行该命令通过输入MATLAB命令窗口。Web浏览器不支持MATLAB命令。金宝app
你也可以从下面的列表中选择一个网站:
表现最好的网站怎么走吗
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。