主要内容

affygcrma

执行GC健壮Multi-array平均(GCRMA)过程Affymetrix微阵列probe-level数据

语法

表达式= affygcrma (CELFiles,CDFFile,SeqFile)
表达式= affygcrma (ProbeStructure,Seq)
表达式= affygcrma (CELFiles,CDFFile,SeqFile……“CELPath”,CELPathValue,……)
表达式= affygcrma (CELFiles,CDFFile,SeqFile……“CDFPath”,CDFPathValue,……)
表达式= affygcrma (CELFiles,CDFFile,SeqFile……“SeqPath”,SeqPathValue,……)
表达式= affygcrma (…“ChipIndex”,ChipIndexValue,……)
表达式= affygcrma (…”,OpticalCorr',OpticalCorrValue,……)
表达式= affygcrma (…“CorrConst”,CorrConstValue,……)
表达式= affygcrma (…“方法”,MethodValue,……)
表达式= affygcrma (…”,TuningParam',TuningParamValue,……)
表达式= affygcrma (…“GSBCorr”,GSBCorrValue,……)
表达式= affygcrma (…“中值”,MedianValue,……)
表达式= affygcrma (…“输出”,OutputValue,……)
表达式= affygcrma (…“Showplot”,ShowplotValue,……)
表达式= affygcrma (…“详细”,VerboseValue,……)

输入参数

CELFiles

有下列:

  • 特征向量或字符串指定一个玻璃纸文件名。

  • ‘*’文件,读取所有移动电话在当前文件夹。

  • ' ',打开选择玻璃纸文件从你选择玻璃纸文件对话框。从这个对话框,你可以按住Ctrl转变当点击选择多个移动电话文件。

  • 单元阵列特征向量包含玻璃纸文件名或字符串向量。

CDFFile

下面的:

  • 特征向量或字符串指定提供文件名。

  • ' ',您选择的选择提供文件对话框提供文件。

SeqFile

下面的:

  • 特征向量或字符串指定一个文件名序列文件(制表符分隔或FASTA),其中包含为特定类型的Affymetrix以下信息®GeneChip®数组:

    • 探针组id

    • 探针x坐标

    • 探针y坐标

    • 在每个探测器设置探针序列

    • Affymetrix GeneChip数组类型(仅FASTA文件)

    序列文件(制表符分隔或FASTA)必须在MATLAB®搜索路径或在当前文件夹(除非你使用SeqPath属性)。在制表符分隔的文件,每一行代表一个探针;FASTA文件中,每个标题代表了一个调查。

  • 一个N25个矩阵序列信息,如返回的affyprobeseqread

Seq

一个N25个矩阵序列信息,如返回的affyprobeseqread

ProbeStructure

MATLAB结构包含来自移动电话的信息文件,包括探针强度,调查指标,和探针组id,返回的celintensityread函数。

CELPathValue

特征向量或字符串指定路径和文件夹中指定的文件CELFiles存储。

CDFPathValue

特征向量或字符串指定路径中指定的文件和文件夹CDFFile存储。

SeqPathValue

特征向量或字符串指定一个文件夹或路径和文件夹SeqFile存储。

ChipIndexValue

正整数指定一个芯片。这个芯片的序列信息和探针强度不匹配的数据被用来计算探测器亲和力。默认是1

OpticalCorrValue

控件的使用光学背景校正输入探针强度值。的选择是真正的(默认)或

CorrConstValue

ρ值指定了相关常数,记录每个点/毫米探针对背景强度。选择任何值≥0≤1。默认是0.7

MethodValue

特征向量或字符串,指定了方法来估计信号。的选择是“初速”更快,特设最大似然估计方法,或“海尔哥哥”较慢,更正式,经验贝叶斯方法。默认是“初速”

TuningParamValue

值,指定使用的调优参数估计方法。这个调优参数集与积极的概率信号值的下界。选择是一个积极的价值。默认是5(企业)或0.5(EB)。

提示

有关确定为这个参数设置的信息,明白了吴et al ., 2004

GSBCorrValue

指定是否执行gene-specific绑定(’)校正使用探针关联数据。的选择是真正的(默认)或。如果没有探针关联信息,该属性将被忽略。

MedianValue

指定使用的排名值的中值代替均值归一化。的选择是真正的(默认)。

OutputValue

指定返回的基因表达值的规模。的选择是:

  • “日志”

  • “log2”

  • “log10”

  • “线性”

  • @functionname

在过去的实例,数据转换为定义的函数functionname。默认是“log2”

ShowplotValue

控制图显示日志的显示2不匹配(MM)从指定的芯片探针强度值(玻璃纸文件),与芯片的毫米探针亲和力。情节的洛斯适合计算讲数据还显示指定的芯片。的选择是真正的,,或,一个整数指定一个芯片。如果设置为真正的,第一个芯片是策划。默认是:

  • ——当返回值指定。

  • 真正的——如果不指定返回值。

VerboseValue

控件的显示读取的文件的状态和GCRMA处理。的选择是真正的(默认)或

输出参数

表达式

DataMatrix对象包含日志2基因表达值,背景调整,规范化,总结使用GC健壮Multi-array平均(GCRMA)过程。

在每一行表达式对应于一个基因(探针),每一列对应一个Affymetrix玻璃纸文件。

描述

表达式= affygcrma (CELFiles,CDFFile,SeqFile)读取指定Affymetrix玻璃纸文件,相关的CDF库文件(从Affymetrix创建GeneChip数组表达或基因分型检测),和相关的序列文件或矩阵。然后处理探测器使用GCRMA背景强度值调整,分位数正常化,和median-polish总结过程,然后返回表达式,一个DataMatrix对象包含日志2在一个矩阵,基于基因表达值调查id设置为行名称和列名的玻璃纸文件名。请注意,每一行表达式对应于一个基因(探针),每一列对应一个Affymetrix玻璃纸文件。(每个玻璃纸文件生成一个单独的芯片。所有芯片应该是相同类型的。)

CELFiles是一个特征向量,字符串,字符串向量,或单元阵列特征向量包含玻璃纸文件名。CDFFile是一个特征向量或字符串指定提供文件名。如果你设置CELFiles‘*’,那么它读取所有文件移动电话在当前文件夹。如果你设置CELFilesCDFFile' ',然后打开选择文件对话框,选择移动电话文件或提供文件。从这个对话框,你可以按住Ctrl转变当点击选择多个移动电话文件。SeqFile是一个文件或矩阵包含为特定类型的探针序列信息Affymetrix GeneChip数组。

请注意

有关阅读的文件和GCRMA处理,明白了celintensityread,affyprobeseqread,affyprobeaffinities,gcrma,gcrmabackadj,quantilenorm,rmasummary

表达式= affygcrma (ProbeStructure,Seq)使用GCRMA背景调整、分位数正常化和median-polish总结程序来处理探针强度值ProbeStructureProbeStructure从移动电话是一个MATLAB结构包含的信息文件,包括探针强度、调查指标,和探针组id,返回的celintensityread函数。Seq是一个矩阵包含为特定类型的探针序列信息Affymetrix GeneChip数组。

表达式= affygcrma (…”,PropertyName”,PropertyValue,……)调用affygcrma与使用属性名可选属性/属性值对。您可以指定一个或多个属性在任何顺序。每一个PropertyName必须包含在单引号,不分大小写。这些属性名称/属性值对如下:

表达式= affygcrma (CELFiles,CDFFile,SeqFile……“CELPath”,CELPathValue,……)指定一个指定的文件的路径和文件夹CELFiles存储。

表达式= affygcrma (CELFiles,CDFFile,SeqFile……“CDFPath”,CDFPathValue,……)指定一个指定的文件的路径和文件夹CDFFile存储。

表达式= affygcrma (CELFiles,CDFFile,SeqFile……“SeqPath”,SeqPathValue,……)指定一个指定的文件的路径和文件夹SeqFile存储。

表达式= affygcrma (…“ChipIndex”,ChipIndexValue,……)从毫米探针强度数据计算探测器亲和力使用序列信息和从指定的芯片探针强度不匹配值ChipIndexValue。默认的ChipIndexValue1

表达式= affygcrma (…”,OpticalCorr',OpticalCorrValue,……)控件的使用光学背景校正输入探针强度值。的选择是真正的(默认)或

表达式= affygcrma (…“CorrConst”,CorrConstValue,……)指定的相关常数,ρ,背景为每个点/毫米探针对强度。选择任何值≥0≤1。默认是0.7

表达式= affygcrma (…“方法”,MethodValue,……)指定的方法来估计信号。的选择是“初速”更快,特设最大似然估计方法,或“海尔哥哥”较慢,更正式,经验贝叶斯方法。默认是“初速”

表达式= affygcrma (…”,TuningParam',TuningParamValue,……)指定使用的调优参数估计方法。这个调优参数集与积极的概率信号值的下界。选择是一个积极的价值。默认是5(企业)或0.5(EB)。

提示

有关确定为这个参数设置的信息,明白了吴et al ., 2004

表达式= affygcrma (…“GSBCorr”,GSBCorrValue,……)指定是否执行gene-specific绑定(’)校正使用探针关联数据。的选择是真正的(默认)或。如果没有探针关联信息,该属性将被忽略。

表达式= affygcrma (…“中值”,MedianValue,……)指定使用的排名值的中值代替均值归一化。的选择是真正的(默认)。

表达式= affygcrma (…“输出”,OutputValue,……)指定返回的基因表达值的规模。OutputValue可以是:

  • “日志”

  • “log2”

  • “log10”

  • “线性”

  • @functionname

在过去的实例,数据转换为定义的函数functionname。默认是“log2”

表达式= affygcrma (…“Showplot”,ShowplotValue,……)控制图显示日志的显示2不匹配(MM)从指定的芯片探针强度值(玻璃纸文件),与芯片的毫米探针亲和力。情节的洛斯适合计算讲数据还显示指定的芯片。的选择是真正的,,或,一个整数指定一个芯片。如果设置为真正的,第一个芯片是策划。默认是:

  • ——当返回值指定。

  • 真正的——如果不指定返回值。

表达式= affygcrma (…“详细”,VerboseValue,……)控件的显示读取的文件的状态和GCRMA处理。的选择是真正的(默认)或

例子

下面的示例假设您有HG_U95Av2.CDF库文件存储在D: \ Affymetrix \ LibFiles \ HGGenome,指出当前文件夹包含玻璃纸文件的位置和序列文件与此相关CDF实验组的库文件。在这个例子中,affygcrma函数读取所有玻璃纸序列文件和文件在当前文件夹和一个提供文件在指定的文件夹中。它也执行GCRMA背景调整,分位数正常化,和总结过程点探测强度值,并返回一个DataMatrix对象,包含元数据和处理数据。

表达= affygcrma (‘*’、‘HG_U95Av2.CDF’、‘HG-U95Av2_probe_tab’,……“CDFPath”、“D: \ Affymetrix \ LibFiles \ HGGenome”);

引用

[1]Naef F。,Magnasco, M.O. (2003). Solving the Riddle of the Bright Mismatches: Labeling and Effective Binding in Oligonucleotide Arrays. Physical Review E68年,011906年。

[2],Z。,我rizarry, R.A., Gentleman, R., Murillo, F.M., and Spencer, F. (2004). A Model Based Background Adjustment for Oligonucleotide Expression Arrays. Journal of the American Statistical Association99 (468),909 - 917。

[3],Z。,我rizarry, R.A. (2005). Stochastic Models Inspired by Hybridization Theory for Short Oligonucleotide Arrays. Proceedings of RECOMB 2004. J Comput Biol.12 (6),882 - 93。

[4],Z。,我rizarry, R.A. (2005). A Statistical Framework for the Analysis of Microarray Probe-Level Data. Johns Hopkins University, Biostatistics Working Papers 73.

[5],Z。,我rizarry, R.A. (2003). A Model Based Background Adjustment for Oligonucleotide Expression Arrays. RSS Workshop on Gene Expression, Wye, England,https://biosun01.biostat.jhsph.edu/%7Eririzarr/Talks/gctalk.pdf

[6]速度、t (2006)。背景模型和GCRMA。讲座10,246年统计,加州大学伯克利分校。

[7],Abd Rabbo附加说明,Barakat, H.M. (1979). Estimation Problems in Bivariate Lognormal Distribution. Indian J. Pure Appl. Math10 (7),815 - 825。

[8]最好,C.J.M.,Gillespie, J.W., Yi, Y., Chandramouli, G.V.R., Perlmutter, M.A., Gathright, Y., Erickson, H.S., Georgevich, L., Tangrea, M.A., Duray, P.H., Gonzalez, S., Velasco, A., Linehan, W.M., Matusik, R.J., Price, D.K., Figg, W.D., Emmert-Buck, M.R., and Chuaqui, R.F. (2005). Molecular alterations in primary prostate cancer after androgen ablation therapy. Clinical Cancer Research11,6823 - 6834。

伊瑞[9],R.A.霍布斯,B。,Collin, F., Beazer-Barclay, Y.D., Antonellis, K.J., Scherf, U., Speed, T.P. (2003). Exploration, Normalization, and Summaries of High Density Oligonucleotide Array Probe Level Data. Biostatistics.4,249 - 264。

[10]Mosteller F。,Tukey, J. (1977). Data Analysis and Regression (Reading, Massachusetts: Addison-Wesley Publishing Company), pp. 165–202.

版本历史

介绍了R2008b