范文一:转录组学
基于高通量测序的储粮害虫抗药性相关基因的转录组学分析及其技术研究
专业:食品科学 姓名:陶冶心 学号:1120140520
摘要:随着测序技术的发展,昆虫转录组数据不断积累,在昆虫学研究中的应用也越来越广泛。在害虫抗药性的研究中,转录组数据分析也是重要的最新研究手段。转录组研究能够从整体水平研究基因功能以及基因结构,揭示特定生物学过程以及疾病发生过程中的分子机理。RNA-Seq作为一种新的高效、快捷的转录组研究手段正在改变着人们对转录组的认识。本文简要介绍了转录组学及其定义,并以RNA测序为例着重介绍了高通量测序在转录组中的应用,并对其中有待进一步研究的问题进行展望。
关键词 :转录组 高通量测序 抗性
Deep Sequencing-based Transcriptome Analysis in insect
resistance research
Abstract:With the development of sequencing technology,the number of known insect transcriptome sequences has increased and transcriptome data has become more useful in entomology,including research on insect resistance.Transcriptome can research from the overall level of gene function and gene structure, revealing the specific molecular mechanism in the process of biological processes and disease. RNA-Seq,as a new kind of efficient, fast transcriptome research techniques ,is changing people's understanding of the transcriptome. Transcriptomics and its definitions are briefly introduced and pick RNA sequencing as an example, fully introduced the application of high-throughput sequencing of the transcriptome, the further research problems are discussed at the same time.
Key words: transcriptome ,High-throughput sequencing, resistance
由于杀虫剂的长期使用,昆虫产生的抗药性已成为农林虫害治理面临的重大问题研究昆虫抗药性机制有助于为农林害虫防控、资源昆虫抗性品系选育及新型杀虫剂研发提供科学指导。长期以来,人们通过对模式昆虫、卫生昆虫和农林害虫的研究,对昆虫代谢抗性、靶标抗性有了一定认识,继而利用分子生物学手段克隆、分析了一些抗性相关基因,上述研究方
案中,受限于序列获得的困难,往往只研究某一个或几个基因,并将代谢抗性和靶标抗性割裂开来分析。组学技术的出现使研究人员有可能对所有抗性相关的基因开展系统的分析。 1转录组学的发展
1.1转录组
转录组(transcriptome)广义上是指在一定生理条件下,某一物种的组织或特定细胞内 的全部转录产物的总和,包括了信使RNA(mRNA)、转运RNA(tRNA)、核糖体RNA (rRNA)和非编码RNA (non-coding RNA, ncRNA)。狭义上指的是细胞内能够转录出的所有mRNA分子。mRNA作为信使RNA通过编码蛋白质,负责将基因的遗传信息传递给行使生物学功能的蛋白质,被认为是DNA与蛋白质之间生物信息传递的“桥梁”[1]。 ncRNA是不被翻译成蛋白质的RNA分子,在转录产物中占的比例也较大,它们对生物体的各项生命活动具有重要的调节作用,如蛋白质合成及降解、蛋白质细胞定位、参与mRNA的稳定性及翻译、mRNA选择性剪接及降解、rRNA的甲基化修饰及假尿啼聢化加工、DNA端粒合成及细胞寿命的调控、染色体复制、染色体表观遗传修饰等[2-3]。
转录组的定义里面包括了时间与空间的限定,显著不同于基因组的固定不变(除基因突变),即同一细胞在不同的生长周期及生长环境下,其基因表达情况不完全相同[4]。
1.2 转录组学
随着当今科学技术的飞速发展,目前越来越多的物种全基因测序工作已完成,下一阶 段我们面临的主要问题就是这些基因的功能有哪些?不同的基因参与了哪些组织细胞中的基因表达的调控?参与哪些生命过程?相同的基因在不同细胞内或者疾病和治疗状态下的表达水平、以及基因与基因产物之间的相互作用等等。因此,在人类基因组测序研究后,科学家们更多的精力转移到功能基因组学的研究中。
功能基因组学(Functional Genomics)是利用结构基因组学提供的信息和产物,以高通量、大规模实验方法,应用统计科学和计算机分析,在基因组或系统水平全面研究功能基因、蛋白质和代谢物,并探索它们之间的相互联系和规律[5]。
转录组学(transcriptomics)是功能基因组学的一个重要组成部分,是一门在整体水平上研究细胞中基因转录的情况及转录调控规律的学科。简而言之,转录组学是从RNA水平研究基因表达的情况,可以用来研究某一生理条件或时空条件下该物种转录水平和正常情况下的差异,能够将功能基因组学与RNA水平的基因表达情况的研究联系起来。因此,在人类基因组计划完成后,转录组学研究很快受到科学家的关注。目前,转录组学已经成为基因表达调控研究的重要手段,从一个细胞或组织基因组的全部mRNA 水平研究基因表达情况,它
能够提供全部基因的表达调节系统和蛋白质的功能、相互作用的信息。基因转录水平上的调控是生物最重要的调控形式,也是现在研究最多的基因表达调控形式。转录组学研究的不断深入,必将为生命科学的更多新领域的探索研究提供高效的方法。
1.3转录组研究技术的发展
转录组学研究是基于高通量的,用大规模的数据研究生命过程中一系列基因的整体水平的转录机理。因此需要先获取大量已知的基因序列信息和转录本序列,并且对所研究对象的基因组需要有一个全局性的了解。
第一个得到描述的转录组是酿酒酵母细胞,共分析了60633个转录本,揭示了4665个基因,其中,1981个基因有已知的功能,而2684个基因从未被鉴定过[6]。随着科技的进步以及转录组研究的不断加深,科学家们已经建立起来了一系列的技术方法,转录组的研究方法主要有以下几种:(1)基于杂交的转录组学方法:基因芯片(DNA microarray);(2)基于测序的转录组学方法:主要包括:表达序列标签(Expressed Sequence Tag,EST)[7,8]、基因表达序列分析(SerrialAnalysis of Gene Expression , SAGE) 、大规模平行测序 (Massively Parallel Signature Sequencing, MPSS);(3)基于新一代高通量测序技术(High-ThroughputSequencing)的转录组测序等等。
2基于新一代高通量技术的转录组学研究方法
2.1新一代高通量技术的测序技术的发展
新一代高通量测序技术(454GS-FLX,Solexa, SOLiD)具有高通量、高检测灵敏度以及低运行成本等优点,堪称测序技术发展历程的一个里程碑,该技术可以对数百万个DNA 分子进行同时测序。这使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,因此也称其为深度测序( deep sequencing) [9]。RNA-Seq技术,又称转录组测序技术,就是近几年发展起来的应用新一代高通量测序进行转录组学研究的技术[10]。原则上,所有的高通量测序技术都能够应用于RNA测序。
20世纪70年代的Sanger法测序技术是最早广泛应用的DNA测序技术[11],它是一种以末端终止法为原理建立起来的技术。Sanger测序作为30多年来惟一的DNA测序方法,对现代生物学研究起到了极大的促进作用。测序时,DNA分子被切断为大的片段,测得大片段的序列后,继续将大片段切断成小片段,逐步测定整个基因组序列。但是,Sanger法技术测序通量低,费时费力且成本高,需要大量的技术人员参与。随着大规模基因组学的兴起,多种高通量低成本的测序技术应运而生,并逐步被应用到生物学研究的各个领域。目前, 新一代测序技术正以Sanger测序无可比拟的速度产生海量数据, 不仅引领生命科学全面进入后基因组
时代,更推动了生物信息学、系统生物学等交叉学科的迅猛发展。
循环芯片测序法(cyclic-arraysequencing)[12]为近年来出现的一种新的测序方法,也可将其称为“新一代测序技术或者第二代测序技术”Next-generation Sequencing Technology)。这一技术不断得到创新和改良,在保证基因组测序足够精确的前提下,操作程序的优化,测序通量急速增加,是传统Sanger法的几百到几千倍,测试的成本也呈现直线下降的趋势,只为原有技术的几十分之一。新一代测序技术的核心思想就是边合成(或者连接)边测序[13]。
自2005年以来,以Roche公司的454技术(Roch GS FLX sequencer,以emulsion-PCR和焦磷酸测序技术为核心)、Illumina公司的Solexa技术(niumina/Solexa Genome Analyzer,核心为单分子阵列原位扩增及边合成边测序技术)和ABI公司的SOLiD技术(ABISOLiD Sequencer,以支持寡核苷酸链接及检测技术为核心)为标志的新一代或下一代测序技(next-generation sequencing techology, NST)相继出现,目前已经比较成熟和商品化,在多个领域得到了广泛应用。在这三种新一代测序平台中,Illumina/Solexa测序平台上的RNA测序技术(RNA sequencing,RNA-seq)应用最为广泛。
2.2 高通量RNA测序及其在转录组研究中的应用
高通量测序技术的迅猛发展,将基因组学水平的研究带入了一个新的时期,也使经典分子生物科学家对基因组学的认识和思考上升到一个新的水平。高通量测序技术不仅可以进行大规模基因组测序,还可用于基因表达分析、非编码小分子RNA的鉴定、转录因子靶基因的筛选和DNA甲基化等相关研究。
近年来,包括基因组、转录组、蛋白质组等的各种组学技术在功能基因发现及鉴定中起着越来越重要的作用。由于全基因组测序费用仍然很高,蛋白质组实验技术有待进一步的提高,转录组研究是基因功能及结构研究的基础和出发点,是全基因组测序完成后首先要面对的问题。最近科学家们将高通量测序技术应用于转录组分析开发出了RNA测序技术( RNA-Seq)。高通量转录组测序避免了克隆亚克隆过程中引入的偏差,且其确定的序列长度显著增加,提高了识别其对应基因的准确性。同时,计算这些短序列的个数和分析其在整个基因组中的分布,可以计算出转录组表达水平。已经广泛应用于细菌、拟南芥、水稻和人类等生物转录组的研究。我国在应用RNA-Seq 进行水稻转录谱分析方面走在了世界的前列。王俊和韩斌领导的研究小组利用RNA-Seq 技术分别对水稻的转录组进行高分辨率的分析,发现水稻具有可变剪切模式基因数目远远高于预期[14-15]。
RNA-Seq即对细胞转录产物进行测序,统计测得的每条序列获得每个特定转录本的表达量,可提供精确的数字化表达谱检测。该技术首先将细胞中的所有转录产物反转录为cDNA
文库,然后将cDNA 文库中的DNA随机剪切为小片段(片段大小根据采取的测序方法的读长而不同),利用新一代高通量测序仪测序直到获得足够的序列。高通量测序避免了亚克隆过程中引入的偏差,且其确定的短序列长度显著增加。获得长度显著增加的短序列所包含信息可以提高识别其对应的基因的准确性,然后计算这些短序列的个数和分析其在整个基因组中的分布,可以计算出细胞的转录组表达水[16]。RNA-Seq技术具有十分广泛的应用领域:
(1)检测新的转录本:Zhang[17] 等运用RNA高通量双向深度测序技术,首次展现了水稻8个组织部位的转录本表达图谱全貌,并且能够精确检测到丰度非常低的转录产物,获得相当可观数量的全新转录本。
(2)基因转录水平研究,如基因表达量、不同样本间差异表达:通过分析不同处理、不同条件下、不同组织间的基因表达差异性,可以将那些显著差异表达的基因与某些生物学功能关联起来,从而为深入研究昆虫体内相关的分子生物学机制奠定基础。李新建在其博士论文中比较了荣昌猪和长白猪的转录本,筛选出1596个差异表达显著的基因[18]。分别对褐飞虱和稻纵卷叶螟的不同发育阶段建库并进行RNA-Seq 测序,进行差异表达分析,获得了大量与发育阶段相关且具有显著表达差异的基因,这些成果为害虫防治研究提供了重要的参考[19]。
(3)基因功能注释。将所测reads与已有数据库(如GO、KEGG)已注释功能的基因相比对分析,从而揭示特定转录状态下的基因的功能和生物通路等。AjaiK等采用454测序平台对牛角癌组织和正常角组织转录本分析,并对909345个转录本进行了GO和KEGG分析[20]。
(4) 转录本结构变异研究,如可变剪接、RNA编辑、基因融合等。转录本结构的变异能揭示基因转录后表达的多样性。可变剪接使一个基因产生多个mRNA转录本,从而翻译成不同的蛋白。早在2004年,家蚕就完成了基因组测序工作,2012年利用RNA-Seq数据纠正了1140个已知的基因结构,发现了几千个新的可变剪接[21]。基因融合是最近利用转录组高通量测序研究的一个新的内容,主要在肿瘤组织中发现。Shancheng Ren等对14个中国汉族人的原发性前列腺癌和他们的正常组织进行RNA-Seq分析,揭示前列腺癌的基因融合、长非编码RNA、可变剪切和体细胞突变的多样性[22]。
(5) 开发SNPs和SSR等。通过比对转录本和参考基因组间的序列,寻找潜在的SNPs或SSRs。Stephen B等对HapMap中60个欧洲后代进行了转录组测序分析,开发了901个人基因组上的cSNP(编码SNP)。Angela Ca’novas等对荷斯坦奶牛乳样品进行转录组分析,开发了33045个具有多态性的cSNPs[20]。
2.3 面临的挑战
随着测序技术的不断进步, 我们能够对转录组开展更为深入的测序工作, 能够发现更多、
更可靠的转录子, 目前的大规模并行测序技术已经彻底改变了我们对转录组的研究方法,测序结果的质量也在不断提高,得到的信息量也在爆炸式增长。然而和其他所有新生技术一样,RNA-Seq 技术也面临着一系列新问题:其一是庞大的数据量所带来的信息学难题,比如如何最好地诠释和比对鉴定多个类似的同源基因,如何确定最佳测序量,获得高质量的转录图谱等[16];其二是如何针对更复杂的转录组来识别和追踪所有基因中罕见RNA亚型的表达变化。有可能提前实现这一目标的将是使用配对末端测序和单分子测序等更新的测序技术,以及使用更长的读段来增加测序深度和覆盖度[23];其三,目前的高通量测序技术大都需要较多的样品起始量, 这使得来源极为有限的生物样品分析受到限制, 因此如何对单细胞或少量细胞进行转录组测序是一个亟待解决的问题。最近这方面的研究也取得了一定进展,如Tang 等[24]建立了一种mRNA-Seq方案,它以PCR为基础扩增单个细胞的mRNA转录组,成功分析了取自小鼠四细胞胚胎时期的单个卵裂球的转录组。然而该方法只能捕捉带有poly(A)尾巴的mRNA,也不能检测绝大多数较长的mRNA(大于3 kb)的5′末端, 同时也不能保留原转录子的方向信息。除此之外还有一些新的针对低数量细胞进行转录组研究的技术正在不断被开发
[25]。最后,标准的RNA-Seq 技术不能提供序列转录的方向信息,而这对于转录组注释尤为重要, 采用single-strand sequencing和strandspecific sequencing技术能很好的解决这一问题,或将成为RNA-Seq 技术发展的一个重要方向。
3 展望
RNA-Seq 为转录组学研究提供了一个很好的契机,不仅提供了转录组序列的全貌,而且提供了基因表达信息,正逐步成为昆虫分子生物学研究的主要工具。美国科学家发起了ik5 计划,拟开展5000种昆虫的基因组测序项目,丰富昆虫基因资源。但由于基因组测序成本高,昆虫种类繁多,RNA-Seq仍然是获取基因资源的主要方式。随着RNA-Seq技术进一步发展,其测序读长和测序准确性将会得到改善,可以更深入具体地研究昆虫的各种复杂生命现象,对害虫防治和资源昆虫利用起到重要的推动作用。此外,由于RNA-Seq数据分析工具和产生的数据特征紧密相关,因此在RNA-Seq技术不断成熟并被广泛应用时,需要更多针对昆虫基因数据进行优化的分析软件,将给生物信息学研究者提供广阔的空间[26~27]。
参考文献
[1] CostaV, Angelini C, De feis I,Ciccodicola A. Uncovering the Complexity of Transcriptomes with RNA-Seq[J]. Journal of Biomedicine and Biotechnology,2010,10:1-20.
[2] 王康宇,王义,孙春玉,等.RNA测序的研究进展[J].江苏农业科学,2014,42(10):12 - 16.
[3]王金花,郜海燕,许晴晴,等.转录组学在果蔬采后衰老生物学的中的研究进展[J].浙江农业科学,2014 (7):1067-1072
[4] Lander, E.S.,Consortium, I.H.GS., Linton, L.M., Birren, B.,Nusbaum, C., Zody, M.C.,Baldwin, J., Devon, K.,Dewar, K., Doyle, M., et al (2001). Initial sequencing andanalysis of the human genome. Nature 409,860-921.
[5]贾琪,吴名耀,梁康迳,等.基因组学在作物抗逆性研究中的新进展[J].中国生态农业学报, Apr. 2014, 22(4): 375385.
[6] Velculescu VE, Zhang L, Zhou W, et al. Characterization of the yeast transcriptome. Cell, 1997, 88∶243~251.
[7] 张棋麟,袁明龙.基于新一代测序技术的昆虫转录组学研究进展[J].昆虫学报,2013,56( 12): 1489-1508
[8]吴春颖,宋经元,陈士林. 表达序列标签在药用植物研究中的应用[J].中草药, 2008,39(5):778-782.
[9]高静,焦雅,张文广.高通量测序序列比对研究综述[J].生命科学研究,2014,18(5):458~464.
[10] 冯超,朱长青,徐昌杰,等.RNA-Seq在果树学研究中的应用[J].果树学报2014,3,11:115~124.
[11] Sanger F, Nicklen S, Coulson A R. DNA sequencing with chain-terminating inhibitors[J]. Proceedings of the National Academy of Sciences, 1977, 74(12): 5463-5467.
[12]乔鑫,李梦,殷豪,等.果树全基因组测序研究进展.园艺学报,2014,41(1):165–177.
[13] Shendure J, Mitra R D, Varma C, et al. Advanced sequencing technologies: methods and goals[J]. Nature Reviews Genetics, 2004, 5(5): 335-344.
[14]许波,张伟强,冯晓曦,等.转录组测序技术在玉米中的应用研究进展[J].玉米科学,2014,22(1):67 ~72.
[15] Zhang G, Guo G, Hu X, et al. Deep RNA sequencing at single base-pair resolution reveals high complexity of the rice transcriptome[J]. Genome research, 2010, 20(5): 646-654.
[16]兰道亮,熊显荣,位艳丽,等.基于RNA-Seq高通量测序技术的牦牛卵巢转录组研究[J].《中国科学》杂志社,2014,44(3):307 ~ 317.
[17]潘嵩,陈岩,朱水芳,等.高通量测序技术及其在检验检疫中的应用展望[J].中国检验检疫科学研究院,2014,5.
[18] 李新建.猪脂肪沉积关键基因筛选及TCTP基因功能研究[C].陕西:西北农林科
技大学,2011.
[19] Daines B, Wang H, Wang L, et al. The Drosophila melanogaster transcriptome by paired-end RNA sequencing[J]. Genome research, 2011, 21(2): 315-324.
[20]周家蓬,裴智勇,陈禹保,等[J]. 基于高通量测序的全基因组关联研究策略, 2014, 36(11): 1099―1111
[21] 刘金定, 张赞, 黄水清, 等. 昆虫 RNA-Seq 数据的分析流程[J]. 应用昆虫学报, 2013, 50(5): 1458-1468.
[22] Ren S, Peng Z, Mao J H, et al. RNA-seq analysis of prostate cancer in the Chinese population identifies recurrent gene fusions, cancer-associated long noncoding RNAs and aberrant alternative splicings[J]. Cell research, 2012, 22(5): 806-821.
[23]刘玉林,李伟,张志翔,等.基于高通量测序的辽东栎转录组学研究[J].生物技术通报,2014,7.
[24] Tang F, Barbacioru C, Wang Y, et al. mRNA-Seq whole-transcriptome analysis of a single cell[J]. Nature methods, 2009, 6(5): 377-382.
[25] Ozsolak F, Milos P M. RNA sequencing: advances, challenges and opportunities[J]. Nature reviews genetics, 2011, 12(2): 87-98.
[26]宋作伟,黄茉莉,薛仁宇,等.基于RNA-Seq技术检测分析家蚕卵巢发育高表达基因[J].蚕业科学,2013,39( 4) : 0663-0673.
[27]刘金定,张赞,黄水清,等.昆虫RNA-Seq数据的分析流程[J].应用昆虫学报,2013,50( 5) :1458-1468.
范文二:多组学实验及数据分析系列之转录组学与蛋白质组学
多组学实验及数据分析系列研习会(第三期)
之转录组学、蛋白质组学和代谢组学
在后基因组时代,生命科学研究开始进入系统、全面、动态的功能探索阶段。多种高通量的研究策略如基因组测序、转录组测序、小RNA 测序、蛋白质组定量实验和代谢组学被组合应用到同一个课题研究中,在原先单个平台产出数据分析挖掘的的基础上增加了多个实验平台产出数据的整合分析。本系列研习会将深入探讨不同平台的实验方法、研究策略、实验设计和数据分析,并介绍多组学实验整合研究的案例,研讨内容由多年实践经验的科研和技术人员进行讲解和带领数据分析的实际上机操作。
主办单位:上海生咨生物科技有限公司 协办单位:上海市药物转化工程技术研究中心 支持单位:上海维基生物科技有限公司 时间:2015年8月11日-8月15日
注:1. 课程具体安排以报名当天的课程表为准;
2.因需上机练习,请自带笔记本电脑,默认是windows 系统,若安装的是linux 或苹果iOS 请自行下载上机软件。 收费标准
单位代表3800元/人,学生3600元/人 (含资料费) 其他优惠:
1. 同一单位2人以上参会,每人优惠100元。
2. 2015年8月1日之前汇款优惠100元,以汇款回执时间为准。
3. 上海市药物转化工程技术研究中心科研合作伙伴、上海生咨生物科技有限公司客户、之前
参会的学员邮件或手机短线推荐的与会者优惠200元。
以上优惠可以同时享受。
会议盖章邀请函和发票于会议结束前发放
交通住宿费用自理,住宿预定需提前一周预定。 提前汇款安排前排座位
住宿协议酒店为 良友饭店,豪华标准间220元/天(含双早),合住每人110元/天(若无法找到合住人需补差价)。 付款方式:
1. 汇款至 上海生咨生物科技有限公司 开户银行:中国农业银行上海奉贤环城东路支行
汇款帐号:03805500040008016
请在汇款前与我们电话联系,汇款后将回单电子邮件发给我们,以便我们确认,汇款请注明“会议+姓名”。 联系人:
李博文 ( Proteome@126.com 并抄送到 2758945544@qq.com ) 手机:18302158776 电话:021-60723312 2. 报到当天现金支付。
讲师信息 侯辰瑞
资深蛋白质组学工程师,具有超过10年的蛋白质组学方向的从业经历,承接过大量的不同类型、不同物种的蛋白质组学服务项目,在实验设计和实施上有丰富的经验。 吴谦
博士 副研究员,上海生物信息技术研究中心质谱平台负责人,从事质谱研究十多年,近年研究方向主要为蛋白质组学、代谢组学及质谱定量分析新方法开发。 于复东
博士、副研究员。2008年1月毕业于中国科学院上海生命科学研究院,获生物信息学博士学位。毕业后一直从事二代测序等高通量数据分析、肿瘤基因组学、及相关数据库开发和分析平台建立等生物信息学研究工作。目前主要从事肿瘤基因组学方面的研究工作,运用系统生物学的方法研究可以应用于临床早期诊断、预后、复发和转移相关的分子标志物基因及其功能等。近年来作为项目负责人完成了国家自然科学基金、上海市博士后基金、上海市白玉兰科技人才基金各一项,作为生物信息学分析平台负责人完成传染病重大专项课题一项,作为技术骨干参与完成863计划项目一项,累积发表SCI 论文十余篇。 俞鸿
上海生咨生物科技有限公司经理,资深生物信息学工程师 具有超过10年生物信息学分析经验。参与了水稻基因组、家蚕基因组、人肝蛋白质组计划以及其他的国家973、863计划及国家自然科学基金等项目。主要从事蛋白质组、基因组方向的数据分析.
往期研习班照片回顾
蛋白质组学实验设计和数据分析研习会
2015年4月23日-4月27日
生物信息学常用软件学习会 2015年5月26日-5月29日
多组学实验及数据分析系列研习会(第三期)
之转录组学、蛋白质组学和代谢组学
回执单
多人参加,可复制此表。
说明:
1. 请将报名回执单传回我处,接到报名表后我们会确认参会名额,并在课前一周发出书面“确认
函”
2. 缴费方式请选择:□ 课前转账 □ 现金缴费 3. 请选择发票类型:□ 会务费 □ 技术服务费
4. 本公司承诺未在酒店预定中赚取差价,对于需要合住的学员,我们尽可能安排合住,但如果未
能找到合住人,则需要补房费差价。
注:酒店预订需提前7天,只限已经汇款的学员。学员可自行预订周边酒店。 如果有多人参加请拷贝上表到同一文件中发送到 ( Proteome@126.com 并抄送到 2758945544@qq.com )
联系人:李博文 手 机:18302158776 Email:
范文三:转录组学的一些概念
Gene Ontology可分为分子功能(Molecular Function),生物过程(biological process)和细胞组成(cellular component)三个部分。蛋白质或者基因可以通过ID对应或者序列注释的方法找到与之对应的GO号,而GO号可对于到Term,即功能类别或者细胞定位。 功能富集分析: 功能富集需要有一个参考数据集,通过该项分析可以找出在统计上显著富集的GO Term。该功能或者定位有可能与研究的目前有关。
GO功能分类是在某一功能层次上统计蛋白或者基因的数目或组成,往往是在GO的第二层次。此外也有研究都挑选一些Term,而后统计直接对应到该Term的基因或蛋白数。结果一般以柱状图或者饼图表示。
1.GO分析
根据挑选出的差异基因,计算这些差异基因同GO 分类中某(几)个特定的分支的超几何分布关系,GO 分析会对每个有差异基因存在的GO 返回一个p-value,小的p 值表示差异基因在该GO 中出现了富集。
GO 分析对实验结果有提示的作用,通过差异基因的GO 分析,可以找到富集差异基因的GO分类条目,寻找不同样品的差异基因可能和哪些基因功能的改变有关。
2.Pathway分析
根据挑选出的差异基因,计算这些差异基因同Pathway 的超几何分布关系,
Pathway 分析会对每个有差异基因存在的pathway 返回一个p-value,小的p 值表示差异基因在该pathway 中出现了富集。
Pathway 分析对实验结果有提示的作用,通过差异基因的Pathway 分析,可以找到富集差异基因的Pathway 条目,寻找不同样品的差异基因可能和哪些细胞通路的改变有关。与GO 分析不同,pathway 分析的结果更显得间接,这是因为,pathway 是蛋白质之间的相互作用,pathway 的变化可以由参与这条pathway 途径的蛋白的表达量或者蛋白的活性改变而引起。而通过芯片结果得到的是编码这些蛋白质的mRNA 表达量的变化。从mRNA 到蛋白表达还要经过microRNA 调控,翻译调控,翻译后修饰(如糖基化,磷酸化),蛋白运输等一系列的调控过程,mRNA 表达量和蛋白表达量之间往往不具有线性关系,因此mRNA 的改变不一定意味着蛋白表达量的改变。同时也应注意到,在某些
pathway 中,如EGF/EGFR 通路,细胞可以在维持蛋白量不变的情况下,通过蛋白磷酸化程度的改变(调节蛋白的活性)来调节这条通路。所以芯片数据pathway 分析的结果需要有后期蛋白质功能实验的支持,如Western blot/ELISA,IHC(免疫组化),over
expression(过表达),RNAi(RNA 干扰),knockout(基因敲除),trans gene(转基因)等。
3.基因网络分析
目的:根据文献,数据库和已知的pathway 寻找基因编码的蛋白之间的相互关系(不超过1000 个基因)。
范文四:转录组学研究进展
转录组研究前沿
随着转录组学,蛋白组学,代谢组学等组学的不断涌现,生物学研究已经跨入后基因组时代,转录组学作为一个率先发展起来的技术开始在生物学前沿研究中得到了广泛的应用。广义转录组(Transcriptome )系指从一种细胞或者组织的基因组所转录出来的RNA 的总和,包括编码蛋白质的mRNA 和各种非编码RNA (rRNA, tRNA, snoRNA, snRNA,microRNA 和其他非编码RNA 等)。狭义转录组系指所有参与翻译蛋白质的mRNA 总和。
转录组研究历史:
自从上世纪90 年代中期以来,学作为一门新技术开始在生物学前沿研究中展露头脚并逐渐成为生命科学研究的热点。如下:1) 蛋白质组研究需要更多的转录组研究的信息:地鉴定基因的功能,因此蛋白质组的数据需要转录组的研究结果加以印证。研究的不断发展,使得转录组研究的范围不断扩大和深化。运用到转录组研究之中,转录组研究中提供的数据量呈现爆炸式的扩增,研究解决科学问题的范围。
目前进行转录组研究的技术主要包括如下三种:(serial signature sequencing) ;3术的特点如下:
基于杂交技术的DNA 芯片技术mRNA 的表达丰度不尽相同,一半左右,另一半mRNA 由种类繁多的低丰度对于低丰度的mRNA ,微阵列技术难以检测,也无法捕获到目的基因小变化。
SAGE 是以Sanger 测序为基础用来分析基因群体表达状态的一项技术。提取实验样品中RNA 并反转录成接着将切割的cDNA 片段与不同的接头连接,然后PCR 扩增连接SAGE 标签二聚体的多聚体)表达谱的研究中,SAGE 可以获得完整的转录组学图谱以及发现新的基因并鉴定其功能、作用机制和通路等。
MPSS 是SAGE 的改进版,获得的cDNA 克隆至具有各种cDNA 片段,然后在T4 DNA 通过杂交将其结合在带有研究非常有效,能在短时间内捕获细胞或组织内全部基因的表达特征。致病基因并揭示该基因在疾病中的作用机制等发挥了重要作用。随着微阵列技术被用于大规模的基因表达水平研究,因为单一的蛋白质组数据不足以清楚2) 非编码 3) 随着新一代高通量测序技术极大拓宽了转录组1)基于杂交技术的微阵列技术;analysis of gene expression) 和(massively 基于新一代高通量测序技术的转录组测序。各种转录组研究技只适用于检测已知序列,却无法捕获新的mRNA 100种的高丰度mRNA ,其总量占总mRNA 组成。因此由于杂交技术灵敏度有限,mRNA 表达水平的微SAGE 技术首先是cDNA ,随后用锚定酶(Anchoring enzyme)切割双链通过标签酶酶切处理并获得得到SAGE 对其测序(关于SAGE 方法细致的介绍请参可以在组织和细胞中定量分析相关基因表达水平。在差异技术首先是提取实验样品RNA 并反转录为cDNA adaptor 的载体库中,并PCR 扩增克隆至载体库中聚合酶和dGTP 的作用下将PCR 产物转换为单链文库,最后的微载体上进行测序。MPSS 技术对于功能基因组MPSS 技术对于鉴定
转录组原因RNA )基于mRNA cDNA ,标签,网站的不同
2parallel )。细胞中通常细胞中约有不到标签形成的标签二聚体,最后通过锚定酶切除接头序列,以形成并考。SAGE MPSS ,接着将 Anti-adaptor
自从2005年上市以来,第二代测序技术对基因组学的研究产生了巨大的影响并被广泛运用到了基因组测序工作之中。转录组测序也被称为全转录组鸟枪法测序(Whole Transcriptome Shotgun Sequencing, WTSS ),以下简称RNA-seq 。
众所周知,真核生物的基因由三类RNA 聚合酶转录:RNA 聚合酶I 和III 负责其种类稀少,功能重要的看家非编码RNA 基因的转录,包括rRNA ,tRNA ,snoRNA ,snRNA 等;而RNA 聚合酶II 负责蛋白质编码基因和调控非编码RNA 的转录,其转录产在加工过程中均会加上3' 端多聚腺苷尾。RNA-seq 是对用多聚胸腺嘧啶进行亲和纯化的RNA 聚合酶II 转录产生的成熟mRNA 和ncRNA 进行高通量测序。所获得的海量数据经过专业的生物信息学分析,既可以还原出一种细胞内基因表达的种种特征。如果对不同种类的细胞进行并行的RNA-seq 及生物信息学分析,即可以获得多种基因表达调控的重要信息。第二代高通量测序技术赋予了RNA-seq 超强的覆盖度和灵敏性,可以检出许多不曾被预测到的由可变剪接或可变3' 多聚腺苷化位点选择导致的mRNA isoforms,以及新的ncRNA 和antisense RNA (反义RNA )。它在研究真核生物的基因表达调控,癌症等疾病的发生机制和新治疗方案确定,遗传育种等方面具有不可估量的潜力,是后基因组时代改变人们的生命认知和生活质量的一股强劲力量。短短几年,该技术已经被广泛用于解析人类基因组可变剪接,以及从酵母到拟南芥到人的基因表达中的重要科学问题。下表是几种转录组研究所用技术的比较:
转录组所用技术
转录组前沿研究简介:
随着高通量测序技术的迅猛发展,转录组研究从以前的微阵列技术,SAGE 及MPSS 技术的低通量模式切换至RNA-seq 的高通量模式。作为蛋白质组研究的基础,RNA-seq 可以识别比蛋白组高一两个数量级的基因,从而帮助科学家构建完整的基因表达谱以及蛋白质相互作用网络。RNA-seq 对于真核生物的基因表达调控,癌症等疾病的发生机制和新治疗方案确定,遗传育种等方面的研究具有不可估量的潜力。以下是关于转录组前沿研究的一些介绍:
1) 单细胞转录组分析
随着高通量测序技术的不断成熟,转录组高通量测序技术在功能基因组学的研究中发挥了非常重要的作用。很多研究表明相同的细胞类型中的基因表达水平也常常显示异质性,对于单个细胞来说,转录组的随机变异性可能决定了细胞的最终命运,因此不同的细胞具有不同的转录组表型,所以从理论上讲,转录组分析应该以单细胞为研究模型,科学家应用单细胞RNA-seq 技术即可获得单细胞的转录组信息。2009年Surali Azim 和 Lao Kaiqin 领导的课题组描述了一种单细胞转录组测序技术如下图:
(Tanget al. 2009 Nat Methods. 6:377-82)
作者通过对单个小鼠卵裂球细胞的RNA- Seq数据进行分析,分析发现至少5个测序所获得的reads 比微阵列技术多出75%(5270)的表达基因,并鉴定了1753个崭新的剪切位点。除此以外,单细胞的RNA-seq 结果表明了在相同的卵裂球或卵母细胞中,至少有8-19%的基因存在两个以上的转录异构体,该现象清楚表明了在胚胎发育过程中单细胞转录组的复杂性。最后,通过对单个Dicer1-/- 和 Ago2-/-卵母细胞的转录组测序,相对野生型来说,Dicer1-/- 和 Ago2-/-卵母细胞分别发现1696和1553个基因异常上调,1571和1121个基因异常下调,而619基因是相同的。这种单细胞RNA-Seq 技术检测将大大提高我们对单个细胞在哺乳动物发育中转录复杂性的理解。
2) 转录组测序确定RNA 结构
非编码RNA 对于基因表达的调控机制的研究成为近年来的热门研究领域,而RNA 的结构是RNA 行使其功能的基础,所以测定RNA 的结构对于理解RNA 功能意义重大。传统的测定RNA 二级结构的方法是用化学试剂或RNA 酶切割RNA 然后通过测序胶进行分析。这种方法的工作量巨大而且对于技术要求很高。
2010年12月份美国加州大学圣克鲁兹分校霍华德·休斯医学研究院Sofie Salama教授所领导的课题组描述了一种通过转录组高通量测序方法测定RNA 结构的方法(Fragmentation sequencing ,FragSeq) ,该方法发表在《自然—方法学》。
(Underwoodet al. 2010. Nat Methods. 7:995-1001)
该方法利用核酸酶P1只切割单链RNA 的特性对小鼠RNA 进行片段化,片段化RNA 的大小在20–100nt 之间,然后在片段的5’和3’端分别加上测序接头,再进行逆转录和PCR 扩增,最后构建FragSeq 文库并对其进行高通量测序。同时作者通过生物信息学分析大量的高通量测序结果,并辅以实验数据成功测定了小鼠的非编码RNA 的二级结构。
3)转录组测序在疾病中的应用
转录组测序 (RNA-seq) 是最近发展起来的利用高通量测序技术进行转录组分析的一种技术, 可全面快速地获得特定细胞或组织在某一状态下的几乎所有的成熟mRNA 和ncRNA 。相对于传统的基因芯片技术,RNA-seq 技术不需要针对已知序列设计探针,即可检测细胞或组织的整体转录水平。RNA-seq 技术具有更灵敏的数字化信号更高的通量以及更广泛的检测范围。在疾病的机制研究以及疾病治疗领域,转录组测序作为一个有力的工具已经被广泛使用。
2010 年7 月, 密歇根大学Arul MChinnaiyan实验室分析了15 例前列腺癌样本的转录组测序结果, 研究发现其中有两例前列腺癌样本的ETS 基因没有发生融合,进一步的研究表明存在于Raf 信号途径中的BRAF 和RAF1基因会发生融合现象,作者同时利用q-PCR 和FISH 技术验证了上述现象的存在。除此以外,作者通过对大批不同的癌症样本进行荧光原位杂交实验,并精确统计了BRAF 和RAF1基因的重排频率,统计结果表明了各种癌症样本如胃癌,肝癌,黑色素瘤和前列腺癌的研究结果具有高度的一致性。此项成果证明了RAF 信号途径在一系列癌症如前列腺癌、胃癌和黑色素瘤发病过程中起到了非常重要的角色, 同时研究成果也表明了RAF 信号途径中的融合基因有潜力成为抗肿瘤治疗与抗肿瘤药物筛选的靶标。
参考文献:
Brenner S, Johnson M, Bridgham J, GoldaG, Lloyd DH, Johnson D, Luo SJ, McCurdy S,Foy M, Ewan M, Roth R, George D,Eletr S, Albrecht G, Vermaas E, Williams SR, Moon K, Burcham T , Pallas M,DuBridge RB, Kirchner J, Fearon K, Mao J, Corcoran K. Gene expression analysisby massively parallel signature sequencing (MPSS) on microbead arrays. Nat Biotechnol, 2000, 18(6):630–634.
Lockhart DJ, Winzeler EA. Genomics,gene expression and DNA arrays. Nature, 2000,405(6788): 827–836.
Palanisamy et al. 2010. Rearrangements of the RAF kinase pathway in prostate cancer ,gastric cancer and melanoma. Nature Medicine. 16: 793-798.
Shendure J, Ji H. Next-generation DNAsequencing. Nat Biotechnol, 2008, 26(10): 1135–1145.
Tanget al. 2009. mRNA-Seq whole-transcriptome analysis of a singlecell. Nat Methods. 6:377-82.
Underwoodet al. 2010. FragSeq:transcriptome-wide RNA structure probing using high-throughput sequencing. Nat Methods. 7:995-1001.
Velculescu VE, Zhang L, Vogelstein B,Kinzler KW. Serial analysis of gene expression.
Science, 1995,270(5235): 484–487.
Wang Z, Gerstein M, Snyder M. RNA-Seq:a revolutionary tool for transcriptomics. NatRev Genet, 2009, 10(1): 57–63.
[ Last edited by 西瓜 on 2011-11-23 at 11:09 ]
Keywords: 转录组研究 生物学
范文五:[考试]多组学实验及数据分析系列之转录组学与蛋白质组学
多组学实验及数据分析系列研习会(第三期)
之转录组学、蛋白质组学和代谢组学
在后基因组时代,生命科学研究开始进入系统、全面、动态的功能探索阶段。多种高通量的研究策略如基因组测序、转录组测序、小RNA测序、蛋白质组定量实验和代谢组学被组合应用到同一个课题研究中,在原先单个平台产出数据分析挖掘的的基础上增加了多个实验平台产出数据的整合分析。本系列研习会将深入探讨不同平台的实验方法、研究策略、实验设计和数据分析,并介绍多组学实验整合研究的案例,研讨内容由多年实践经验的科研和技术人员进行讲解和带领数据分析的实际上机操作。
主办单位:上海生咨生物科技有限公司
协办单位:上海市药物转化工程技术研究中心
支持单位:上海维基生物科技有限公司
时间:2015年8月11日,8月15日
地点:上海良友饭店,静安区南苏州路1455号
8月11日(周二)下午14:30,17:30 或8月12日上午8:30-9:30注册。
1. 蛋白质组学常用实验方法
上午(9:30-12:00) 1.1 基于凝胶技术的定量蛋白质组学
1.2 基于质谱技术的蛋白质组学研究
2.蛋白质搜库和差异蛋白筛选
2.1 蛋白质组学数据分析搜索引擎 8月12日(周三) 2.2 如何提高蛋白鉴定覆盖度 下午(13:30-17:30) 2.3 质谱搜库软件演示和maxquant上机实习
2.4 差异蛋白筛选方法
8月13日(周四) 3.转录组实验设计和数据分析
上午(9:00-12:00) 3.1 转录组测序数据分析及其在临床医学方面的应用研究
4.蛋白质组数据分析
4.1 NCBI、UNIRPOT数据库资源介绍 8月13日(周四) 4.2 Gene Ontology介绍 下午(13:30-17:30) 4.3 KEGG网站介绍
4.4 蛋白质组学数据分析
5.蛋白相互作用网络分析功能介绍和上机操作 8月14日(周五) 5.1 cytoscape
上午(9:00-12:00) 5.2 pajek
5.3 STRING
6.常用分析上机练习包括:
8月14日(周五) 6.1 维恩分析
下午(13:30-17:30) 6.2 层次聚类和热图
6.3 k-means聚类
6.4 主成分分析
6.5 GO功能分析和富集分析
6.6 KEGG通路分析
6.7 DESeq
7. 代谢组学研究方法 8月15日(周六) 7.1 代谢组学实验设计及样本处理 上午(9:00,12:00) 7.2 代谢组学数据处理,多维统计分析
8. 多组学整合分析案例介绍 8月15日(周六) 9. 科研工作中的专利挖掘和专利保护 下午(13:30,17:30) 自由上机和交流
注:1.课程具体安排以报名当天的课程表为准;
2.因需上机练习,请自带笔记本电脑,默认是windows系统,若安装的是linux或苹果iOS请自行下载上机软件。
收费标准
单位代表3800元/人,学生3600元/人 (含资料费)
其他优惠:
1. 同一单位2人以上参会,每人优惠100元。
2. 2015年8月1日之前汇款优惠100元,以汇款回执时间为准。
3. 上海市药物转化工程技术研究中心科研合作伙伴、上海生咨生物科技有限公司客户、之前
参会的学员邮件或手机短线推荐的与会者优惠200元。 以上优惠可以同时享受。
会议盖章邀请函和发票于会议结束前发放
交通住宿费用自理,住宿预定需提前一周预定。
提前汇款安排前排座位
住宿协议酒店为 良友饭店,豪华标准间220元/天(含双早),合住每人110元/天(若无法
找到合住人需补差价)。
付款方式:
1( 汇款至 上海生咨生物科技有限公司
开户银行:中国农业银行上海奉贤环城东路支行
汇款帐号:03805500040008016
请在汇款前与我们电话联系,汇款后将回单电子邮件发给我们,以便我们确认,汇款请注明“会
议+姓名”。
联系人:
李博文 ( Proteome@126.com 并抄送到 2758945544@qq.com )
手机:18302158776 电话:021-60723312
2( 报到当天现金支付。
讲师信息
侯辰瑞
资深蛋白质组学工程师,具有超过10年的蛋白质组学方向的从业经历,承接过大量的不同类型、不同物种的蛋白质组学服务项目,在实验设计和实施上有丰富的经验。
吴谦
博士 副研究员,上海生物信息技术研究中心质谱平台负责人,从事质谱研究十多年,近年研究方向主要为蛋白质组学、代谢组学及质谱定量分析新方法开发。
于复东
博士、副研究员。2008年1月毕业于中国科学院上海生命科学研究院,获生物信息学博士学位。毕业后一直从事二代测序等高通量数据分析、肿瘤基因组学、及相关数据库开发和分析平台建立等生物信息学研究工作。目前主要从事肿瘤基因组学方面的研究工作,运用系统生物学的方法研究可以应用于临床早期诊断、预后、复发和转移相关的分子标志物基因及其功能等。近年来作为项目负责人完成了国家自然科学基金、上海市博士后基金、上海市白玉兰科技人才基金各一项,作为生物信息学分析平台负责人完成传染病重大专项课题一项,作为技术骨干参与完成863计划项目一项,累积发表SCI论文十余篇。
俞鸿
上海生咨生物科技有限公司经理,资深生物信息学工程师 具有超过10年生物信息学分析经验。参与了水稻基因组、家蚕基因组、人肝蛋白质组计划以及其他的国家973、863计划及国家自然科学基金等项目。主要从事蛋白质组、基因组方向的数据分析.
往期研习班照片回顾
蛋白质组学实验设计和数据分析研习会 生物信息学常用软件学习会
2015年,月23日,4月27日 2015年5月26日,5月29日
多组学实验及数据分析系列研习会(第三期)
之转录组学、蛋白质组学和代谢组学
回执单
多人参加,可复制此表。
职称或导 师姓名 姓名 性别
E-mail 手机 快递地址
您的主要研究方向和物种类别 单位/系别 住宿 无需预订[ ] 单人[ ]
全称 选择: 协议酒店[ ] 合住[ ] 酒店预订 月 日 至 月 日
发票抬头全称
研讨班信息来源渠道
说明:
1. 请将报名回执单传回我处,接到报名表后我们会确认参会名额,并在课前一周发出书面“确认
函”
2. 缴费方式请选择:? 课前转账 ? 现金缴费 3. 请选择发票类型:? 会务费 ? 技术服务费
本公司承诺未在酒店预定中赚取差价,对于需要合住的学员,我们尽可能安排合住,但如果未4.
能找到合住人,则需要补房费差价。
注:酒店预订需提前,天,只限已经汇款的学员。学员可自行预订周边酒店。
如果有多人参加请拷贝上表到同一文件中发送到 ( Proteome@126.com 并抄送到 2758945544@qq.com )
联系人:李博文
手 机:18302158776