• 2011全国数模b题 > 基于GIS的基因表达图谱模型的建立与应用
  • 基于GIS的基因表达图谱模型的建立与应用

    免费下载 下载该文档 文档格式:PDF   更新时间:2011-04-06   下载次数:0   点击次数:2
    文档基本属性
    文档格式:PDF
    文档标题:基于GIS的基因表达图谱模型的建立与应用
    文档作者:
    关键词:
    主题:
    单位:
    文档创建者:Adobe InDesign CS3 (5.0.4)
    创建时间:
    上次保存时间:D:20110406110511+08'00'
    修订:Adobe PDF Library 8.0
    点击这里显示更多文档属性
    立; (3)同一肿瘤的基因表达水平在不同样本间是相 近的(或接近相同)。 基于以上3个假设, 我们得出合理推断, 正常样 本基因表达的空间变化相对平稳, 而肿瘤样本则相 反, 因此, 我们可以以正常样本基因表达数据为基准 构建包含肿瘤基因信息的基因表达图谱模型, 并通 过分析基因表达图谱模型来找出信息基因。 1 材料与方法 1.1 研究数据 研究数据来自2010年全国研究生数学建模竞 赛A题数据(http://ngmcm.sysu.edu.cn/), 共2 000个基 因, 62个样本, 包括22个正常样本和40个癌症样本。 对数据初步分析后, 去除重复基因和不完整基因表 达数据, 最终确定1 991个基因表达数据作为本文的 研究数据。 这里定义正常样本为N, 癌症样本为C, 可用如 下公式表示: , 且其每一列定义为
    Page 2
    赵龙山等: 基于GIS的基因表达图谱模型的建立与应用 403 , 且其每一列定义为 并定义矩阵T如下: 其中, 图1列出了利用半变异函数对正常样本(N)的结 果。从图中可以看出, 在以0.01为步长的情况下, 样 本数据在空间相对距离小于0.06的情况下, 具有较 强的空间相关性, 即N中相邻6个基因表达数据在空 间上是相关的(图1)。 图1 样本N的空间相关性 Fig.1 Spatial correlation of the sample N 1.2.2 去噪 通过邻域分析法来消除基因表达图 谱模型中变化过大的格网值, 这些值可能是由于数 据获取过程中产生的一些误差, 对分析结果产生影 响, 其计算公式为[12]: 式中, g(i, j)为去噪后的基因表达图谱模型栅格 值; 为了避免中心值过高对平均值的影响, 在运算时 取相邻8个值进行计算, 其运算方法见图, 其模板如 下: 模板的运算如图2所示, 为了保持数据大小不 变, 运算时在数据的上、下、左、右各加一行或一列。

    上一页下一页

  • 下载地址 (推荐使用迅雷下载地址,速度快,支持断点续传)
  • 免费下载 PDF格式下载
  • 您可能感兴趣的
  • 2011国模  b照考试模拟试题2011  qq飞车2011最好的b车  b百度一下2011jia  qq飞车b车排行榜2011  2011计算机一级b考试  matlab2011b  飞车b车排行榜2011  2011全国楼市最新降价