基因芯片Pro-processions -------Bioconductor 安装包

    xiaoxiao2021-04-03  61

    基于R的一个用于分析高通量基因组数据的工具,Bioconductor的应用功能是以包的集成形式呈现在用户面前,它提供的软件包中包括各种基因组数据分析和注释工具,其中大多数工具是针对DNA微阵列或基因芯片数据的处理、分析、注释及可视化的。同时,Bioconductor。还提供许多与DNA微阵列相关的数据包。开源,每年更新一次。

    1.打开R直接 install.packages("affy");                   结果:

     package ‘affy’ is not available (as a binary package for R version 3.1.3)

    source("http://bioconductor.org/biocLite.R")      //安装下载脚本

    biocLite("affy");

    这是一开始出现的问题

    一直没有解决,parallel包一直下载不了,最后没办法,只好下载3.2.3版本,直接下affy就好了

    2.R中Update all/some/none? [a/s/n]

      还不清楚,我直接 n 拒绝更新 >>>>  如果R包改动有需求的话,可以“yes”

    3.设置Rstudio中的包存储路径

    4.(.packages())查看加载包

    5  包parallel    load不了,

      Update all/some/none? [a/s/n]: n         Warning message:          package ‘parrallel’ is not available (as a binary package for R version 3.1.3)

    6. installed.packages()[,c('Package','Version','LibPath')]    查看已安装包

    7 package ‘BiocInstaller’ was built under R version 3.2.0

     是由R 3.2.0版本开发的

    8.  not allocate 1.6G for vector 是因为R为32位的

    32位内存分配少,但是运行快,而64位内存分配多,大数据处理时候遇到的内存问题比较少

    如果你的操作系统不支持64位程序,或者你的计算机内存小于4GB,那么应该选择32位版本的R。如果操作系统支持64位版本的R,那么适用于windows系统和Mac系统的R安装程序会自动安装两个版本的R   

    10 背景校正去噪音 rma()         //          

                           mas5()         //

                             gcrma()   //

    MAS5每个芯片可以单独进行标准化,RMA由于采用的多芯片模型需要所有芯片一起进行标准化。

    MAS5利用MM探针的信息去除背景噪声,基本思路是PM-MM。

    RMA不使用MM信息,而是基于PM的信号分布采用随机模型来评估表达值。

    RMA处理后的数据是经过以2为底的对数转换的,而MAS5不是,这一点非常重要。

    一:安装基本的Bioconductor组件

    BioC的官方网站上http://bioconductor.org/,存放着Bioc包的安装脚本,biocLite.R, 每次需要安装BioC的包之前,我们运行该脚本。source是运行代码脚本的命令,可以是本地文件,可以是网络上的文件。需要你有流畅的网络链接

    source(“http://bioconductor.org/biocLite.R”)

    biocLite()

    biocLite()是安装函数,相当于R中的常用的install.package命令,如果不传递需要安装的包的名称,那么则安装如下的组建。 affy, affydata, affyPLM, affyQCReport, annaffy, annotate, Biobase,biomaRt, Biostrings, DynDoc, gcrma, genefilter, geneplotter, GenomicRanges, hgu95av2.db, limma,marray, multtest, vsn, xtable. 在下载和安装完成之后,会打印 Installation complete  TRUE.

     

    Bioconducto中包含的各种包:http://bioconductor.org/packages/release/bioc/

     

    同时biocLite()也有其他的参数,控制安装。

    pkgs    字符,指定需要安装的包

    destdir    文件系统路径

    lib    安装包的库

     

    二:安装额外的包

    除了一种所描述的默认安装的包之外,RBioc有非常多的其他的包供安装,bioc包的分类参见[color=rgb(26, 129, 194)]BiocViews 假设我们需要安装一个名为EBImage的包

    source(“http://bioconductor.org/biocLite.R”)

    biocLite(“EBImage”)

     

    可以同时安装多个包

    biocLite(c(pkg1,pkg2))

     

    三:升级安装的包

    Bioc的包尤其是那些开发版本的包,升级的非常频繁,如果需要同步更新的代码,需要升级。打开新的R。运行

    source(“http://bioconductor.org/biocLite.R”)

    old.packages(repos=biocinstallRepos())

     

    升级所有已经安装的包,运行

    source(“http://bioconductor.org/biocLite.R”)

    update.packages(repos=biocinstallRepos(), ask=FALSE)

    请阅读update.packages的帮助文档,获得更多的信息。极少的情况下,需要重新编译bioc的包,为了兼容C或者Fortran, 一个方法就是输入并且运行

    source(“http://bioconductor.org/biocLite.R”)

    pkgs <- rownames(installed.packages())

    biocLite(pkgs)

    这将重新安装所有目前的已安装包,大家需要注意,可能对带宽要求极高。一般不建议进行。

    转载请注明原文地址: https://ju.6miu.com/read-666029.html

    最新回复(0)