范文一:454测序技术服务(第二代测序)
454测序技术服务(第二代测序)
一,原理:(GS FLX系统超高通量测序) 454 GS FLX 基因组测序仪的原理是通过焦磷酸盐测序原理与微流体技术的整合。它是一种新的依赖生物发光进行 DNA 序列分析的技术,在 DNA 聚合酶、 ATP 硫酸化酶、荧光素酶和双磷酸酶的协同作用下,将引物上每一个 dNTP 聚合与一次荧光信号释放偶联起来,通过检测荧光的释放和强度,达到实时测定 DNA 序列的目的
二,北京诺赛基因组研究中心有限公司
三,454测序技术服务(GS FLX系统超高通量测序)
特色
? 支持各种不同来源的样品:包括基因组DNA,PCR产物 ? BAC,cDNA,小分子RNA等等
? 提供了完整的从样品制备到后续的生物信息学分析解决方案
? 为目前遗传分析和功能基因组等热门研究领域的部分热门课题
? 提出了全新的应用方案。针对不同客户的不同需求,量身定做不同的测序解决方案
原理
454 GS FLX 基因组测序仪的原理是通过焦磷酸盐测序原理与微流体技术的整合。它是一种新的依赖生物发光进行 DNA 序列分析的技术,在 DNA 聚合酶、 ATP 硫酸化酶、荧光素酶和双磷酸酶的协同作用下,将引物上每一个 dNTP 聚合与一次荧光信号释放偶联起来,通过检测荧光的释放和强度,达到实时测定 DNA 序列的目的,此技术不需要荧光标记的引物或核酸探针,也不
需要进行电泳,具有分析结果快速、准确、灵敏度高和自动化的特点。
服务流程
? 剪切、连接:基因组DNA“剪切”成300,800个碱基的片断,然后和两个衔接子A、B进行平端连接。A、B 衔接子各自含有20个碱基的PCR 引物序列、20个碱基的测序引物序列和4个碱基的对照序列(TACG),除此之外,B衔接子的5’端还标记有一个生物素基团,供后续的分离合适的测序模板使用
? 单链DNA模板的分离
emPCR (emulsion PCR):仅含有A、B衔接子单链DNA模板和过量的?
DNA 捕捉珠子退火结合,并被吸附到一种用于PCR反应的油-水混合物的小滴上,以单链的DNA为模板进行PCR扩增,结果得到大量同一序列的DNA链 ? 测序反应
提供服务
? 全基因组测序
(1)多达120 Mb的未知基因组的测序
,生成基因组结构概图
,研究DNA序列的组织,分布和信息
,基因筛查:寻找新基因,定位和功能
,和其他基因组进行比较研究
,识别单碱基突变
,识别突变热点和保守区域
,识别插入或者缺失的基因
,断定基因型和表型之间的相关关系(比如,研究药物抗性的遗传基础) ,基于基因测序变化进行毒性预测
,进行流行病学分析
,了解工业生产菌株和它们的亲代菌株序列上的差异作为进行工业生产菌株开
发的遗传基础
,进行宏基因组 (metagenomics)研究
,古代化石DNA 测序研究
(2)比较基因组及分子进化分析:序列同源比对、通过相邻物种的比较基因组研究进行进化分析、基因注释、功能分类等 (3)利用配对末端方法(Pair-End Tag)将Contigs拼接成Scaffolds。
? 转录组和基因调节研究
(1)基于短Tags,ESTs, ChIP,或者GIS-PET序列的高通量转录组分析,或者miRNA 序列的基因组范围识别,小分子和非编码RNA的测序。
)研究DNA的甲基化模式来进行基因调节的研究。 (2
? 扩增产物分析
PCR产物的超精细测序(应用于医学研究的重测序)
,在混合的肿瘤样本中识别体细胞突变
,在群体水平上发现高可信度的SNP位点
? 信息分析
(1)基本信息分析:图像识别,basecalling,过滤接头序列,检测可能的样品污染。
(2)高级信息分析
A 基因组注释:包括基因组组分分析、基因预测、重复序列注释、Non-coding RNA预 测和假基因(Pseudogene)注释等。
B 基因的功能注释及分类: 通过比对软件(Blast系列软件包)与公共数据中序列做同源性联配,在保证严格置信度标准前提下,对基因进行功能注释。最全面数据库的使用,保证所得数据与国际同步,最大限度挖掘基因组信息。
范文二:二代测序技术比较Illumina_、454_、ABI_测序仪比较
二代测序技术比较 Illumina_、 454_、 ABI_测序仪比较 .docIllumina 、 454 、 ABI 测序仪比较
Illumina 测序仪
Illumina 公司的新一代测序仪 Genome Analyzer最早由 Solexa 公司研发, 利用其专利核心技术 “DNA 簇 ” 和 “ 可逆性末端终结(reversible terminator) ” ,实现自动化样本制备及基因组数百万个 碱基大规模平行测序。 Illumina 公司于 2007年花费 6亿美金的巨资收购了 Solexa , 就是为了促 成 Genome Analyzer的商品化。 Genome Analyzer作为新一代测序技术平台,具有高准确性, 高通量,高灵敏度,和低运行成本等突出优势,可以同时完成传统基因组学研究(测序和注释) 以及功能基因组学 (基因表达及调控,基因功能,蛋白 /核酸相互作用)研究。
Genome Analyzer自上市以来,已经为千人基因组计划立下了赫赫战功。今年早期,荷兰科学 家利用它首次绘出女性的基因组图谱。而就在前两周, 《 Nature 》杂志上一连出现三个人类基因 组图谱:炎黄一号 -第一个亚洲人图谱;第一个癌症病人图谱;第一个非洲人图谱。它们全是依 赖 Genome Analyzer完成的。哗,一下就来仨!这和第一个人类基因组图谱的 13年形成了多 么鲜明的对照。
根据去年底的数据, Genome Analyzer已售出约 200台,估计是市场占有率最广的。前不久, 华大基因再添置了 12台,准备放在香港和深圳的实验室,至此华大基因已经有 29台 Genome Analyzer 。而著名的麻省理工学院和哈佛大学 Broad 研究院拥有 47台 Illumina 测序仪。众多实 验室之所以选择 Illumina ,看中的无疑是 Genome Analyzer的高性价比。
上个月, Illumina 将 Genome Analyzer II升级到 Genome Analyzer IIx,距年底实现单次运行获 得 95 GB数据的宏伟目标又近了一步。 Genome Analyzer IIx有两个核心特征:其一是更大的试 剂冷却器,支持超过 100个测序循环,进一步提升了系统的易用性和自动化;其二是全新的流 动池支架,让每轮运行所得的高质量数据增加 20%。依靠系统软件和试剂的改进, Genome Analyzer IIx现在能够支持 100 bp以上的配对末端读长,并在每次运行中产生超过 20 GB的高 质量数据。
Genome Analyzer技术的基本原理:
1. 文库制备
将基因组 DNA 打成几百个碱基(或更短)的小片段,在片段的两个末端加上接头 (adapter)。
2. 产生 DNA 簇
利用专利的芯片,其表面连接有一层单链引物, DNA 片段变成单链后通过与芯片表面的引物碱 基互补被一端 “ 固定 ” 在芯片上。 另外一端 (5’ 或 3’ ) 随机和附近的另外一个引物互补, 也被 “ 固定 ” 住, 形成 “ 桥 (bridge) “ 。 反复 30轮扩增, 每个单分子得到了 1000倍扩增, 成为单克隆 DNA 簇。 DNA 簇产生之后,扩增子被线性化,测序引物随后杂交在目标区域一侧的通用序列上。
3. 测序
Genome Analyzer系统应用了边合成边测序(Sequencing By Synthesis)的原理。加入改造过 的 DNA 聚合酶和带有 4种荧光标记的 dNTP 。 这些核苷酸是 “ 可逆终止子 ” ,因为 3’ 羟基末端带 有可化学切割的部分,它只容许每个循环掺入单个碱基。 此时, 用激光扫描反应板表面,读取每 条模板序列第一轮反应所聚合上去的核苷酸种类。之后,将这些基团化学切割,恢复 3' 端粘性, 继续聚合第二个核苷酸。如此继续下去,直到每条模板序列都完全被聚合为双链。这样,统计每 轮收集到的荧光信号结果,就可以得知每个模板 DNA 片段的序列。目前的配对末端读长可达到 2×50 bp, 更长的读长也能实现, 但错误率会增高。 读长会受到多个引起信号衰减的因素所影响, 如荧光标记的不完全切割。
4. 数据分析
自动读取碱基,数据被转移到自动分析通道进行二次分析。
Genome Analyzer系统之所以如此畅销,关键在于其技术上的优势。
1. 可扩展的超高通量
Genome Analyzer系统目前每次运行后可获得超过 20 GB的高品质过滤数据。这个技术的可扩 展性保证了更高的数据密度和输出, 能用更少的经费完成更复杂的项目。 到今年底, 通量还有望 上升到 95 GB,相当于人类基因组的 30倍覆盖度。
2. 需要样品量少
Genome Analyzer系统需要的样品量低至 100ng ,能应用在很多样品有限的实验(比如免疫沉 淀、显微切割等)中。这也是很多研究人员所考虑的因素。
3. 简单、快速、自动化
Genome Analyzer系统提供了最简单和简洁的工作流程。即使是最小的实验室也能像大型基因
组中心一样进行大规模的实验。 制备样品文库可以在几小时内完成, 一个星期内就能得到高精确 度的数据。 Cluster Station可以说是 Genome Analyzer的核心。 由独立软件控制的自动生成 DNA 簇的过程可以在 5小时之内(30分钟手工操作)完成。这个自动化的流程不需要进行 Emulsion PCR ,减少了手工操作误差和污染可能性,也不需要机器人操作或洁净室。快速的实验流程使 Genome Analyzer的能力增至最大,而自动化步移降低了项目的时间和费用。
4. 新颖的测序化学技术
Genome Analyzer通过合成测序来支持大规模并行测序。利用新颖的可逆荧光标记终止子,可 以在 DNA 链延伸的过程中检测单个碱基掺入。 由于四个可逆终止子 dNTP 在每个测序循环都存 在,自然的竞争减少了掺入的误差。
5. 单个或配对末端支持
Genome Analyzer系统支持单个片段或配对末端文库。文库构建过程简单,减少了样品分离和 制备的时间。制备基因组 DNA 的单个片段或配对末端文库需要 6个小时,只有 3个小时需要手 工操作。 2×50个碱基或更长的读长增加了比对基因组的能力,并拓展了在其他方面的应用。
然而,精明的用户更看重的是性价比,这也是他们选择 Illumina 的重要原因。 Illumina 的售价约 为 45万美元,低于 454 GS FLX的 50万和 SOLiD 系统的 59万(以上皆为美国的售价)。此 外, 运行成本也是一个关键因素。 美国凤凰城翻译基因组学研究院 (TGen ) 的主管 David Duggan曾表示, 当年购买新一代测序仪时, 每次运行的费用就成为他下决定的主要因素。 他最终选择了 Illumina Genome Analyzer,因为每轮的运行费用为 3000-4000美元(2007年的数据),较为 合理,而其他测序仪可能更高。当然,他也综合考虑了通量、运行时间和样品量。
弗吉尼亚联邦大学的高原(音译)博士认为:“Genome Analyzer的操作费用、易用性和可扩展 性让我实现了大规模基因组实验。 现在, 我的小型实验室正在进行过去只能在大型基因组中心才 能完成的实验。低样品需求、简单的流程、高质量的数据以及应用灵活性让 Illumina Genome Analyzer 从其他高通量测序技术中脱颖而出。 ”
ROCH-454 测序仪
454公司可谓新一代测序技术的奠基人。 2005年底, 454公司推出了革命性的基于焦磷酸测序 法的超高通量基因组测序系统 —— Genome Sequencer 20 System,被《 Nature 》杂志以里程碑 事件报道,开创了边合成边测序(sequencing-by-synthesis )的先河。之后, 454公司被罗氏诊 断公司以 1.55亿美元收购。一年后,他们又推出了性能更优的第二代基因组测序系统 —— Genome Sequencer FLX System (GS FLX)。 去年 10月, 全新的 GS FLX Titanium系列试剂和 软件的补充,让 GS FLX的通量一下子提高了 5倍,准确性、读长也进一步提升。
想当年, GS 20的出现,揭开了测序历史上崭新的一页。 Jonathan Rothberg博士就是大规模并 行测序的发明者,同时也是 454的创始人。上世纪 90年代,很多学者也都想到了大规模并行测 序,他们试图将 Sanger 测序移到芯片上,但都以失败告终,因为这项技术没有可扩展性。 1999年, Rothberg 的儿子出世,他放了两个星期的陪产假。小家伙出生后被送入婴儿特护病房,
Rothberg 非常担心,甚至想获取儿子的基因组信息。这段担惊受怕的经历给了他灵感,他突然 意识到焦磷酸测序 (pyrosequencing ) 不仅简单, 而且具有可扩展性。 两个星期之后, Rothberg 就开始设计芯片和流动室,让测序在更小的反应室中进行,并同时进行几百万个反应。
硬件的设计和制造也只是成功的一半,在样品制备上还有同样漫长的路要走。 Rothberg 摒弃了 传统的细菌克隆与挑选,将 DNA 打断成随机片段,并寻找一种方法来克隆每个片段。受到其他 学者乳液实验的启发,他也想将 DNA 放入油包水的乳液中,这样就省去了反应管。一个好汉三 个帮。在 Joel Bader等人的帮助下, Rothberg 验证了这些想法的可行性,并利用了炸药中的表 面活性剂来维持乳液的热稳定性。就这样,乳液 PCR 终于诞生了。
之后, 454生命科学公司用新一代测序仪对 DNA 双螺旋结构的发明者 James Watson进行了基 因组测序。第一份个人基因组图谱的绘制只用了两年时间,花费不到 100万美元。虽然现在看 来这并不算什么,但就当时而言,它相对于人类基因组计划已是质的飞跃。
GS FLX系统的工作流程
GS FLX系统的流程概括起来,就是 “ 一个片段 = 一个磁珠 = 一条读长(One fragment = One bead = One read) ” 。
1)样品输入并片段化:GS FLX系统支持各种不同来源的样品,包括基因组 DNA 、 PCR 产物、 BAC 、 cDNA 、 小分子 RNA 等等。 大的样品例如基因组 DNA 或者 BAC 等被打断成 300-800 bp的片段;对于小分子的非编码 RNA 或者 PCR 扩增产物,这一步则不需要。短的 PCR 产物则可 以直接跳到步骤 3) 。
2)文库制备:借助一系列标准的分子生物学技术,将 A 和 B 接头(3’ 和 5’ 端具有特异性)连接 到 DNA 片段上。接头也将用于后续的纯化,扩增和测序步骤。具有 A 、 B 接头的单链 DNA 片 段组成了样品文库。
3)一个 DNA 片段=一个磁珠:单链 DNA 文库被固定在特别设计的 DNA 捕获磁珠上。每一个 磁珠携带了一个独特的单链 DNA 片段。 磁珠结合的文库被扩增试剂乳化, 形成油包水的混合物, 这样就形成了只包含一个磁珠和一个独特片段的微反应器。
4)乳液 PCR 扩增:每个独特的片段在自己的微反应器里进行独立的扩增,而没有其他的竞争 性或者污染性序列的影响。 整个片段文库的扩增平行进行。 对于每一个片段而言, 扩增后产生了 几百万个相同的拷贝。随后,乳液混合物被打破,扩增的片段仍然结合在磁珠上。
5)一个磁珠=一条读长:携带 DNA 的捕获磁珠随后放入 PTP 板中进行后继的测序。 PTP 孔的 直径(29um )只能容纳一个磁珠(20um )。然后将 PTP 板放置在 GS FLX中,测序开始。放 置在四个单独的试剂瓶里的四种碱基,依照 T 、 A 、 C 、 G 的顺序依次循环进入 PTP 板,每次只 进入一个碱基。如果发生碱基配对,就会释放一个焦磷酸。这个焦磷酸在 ATP 硫酸化酶和萤光 素酶的作用下, 经过一个合成反应和一个化学发光反应, 最终将萤光素氧化成氧化萤光素, 同时 释放出光信号。此反应释放出的光信号实时被仪器配置的高灵敏度 CCD 捕获到。有一个碱基和 测序模板进行配对,就会捕获到一分子的光信号;由此一一对应, 就可以准确、 快速地确定待测 模板的碱基序列。这也就是大名鼎鼎的焦磷酸测序。
6)数据分析:GS FLX系统在 10小时的运行当中可获得 100多万个读长,读取超过 4-6亿个 碱基信息。 GS FLX 系统提供两种不同的生物信息学工具对测序数据进行分析,适用于不同的 应用:达 400 MB的从头拼接和任何大小基因组的重测序。
GS FLX系统的准确率在 99%以上。其主要限制来自同聚物,也就是相同碱基的连续掺入,如 AAA 或 GGG 。 由于没有终止元件来阻止单个循环的连续掺入, 同聚物的长度就需要从信号强度 中推断出来。这个过程就可能产生误差。因此, 454测序平台的主要错误类型是插入 -缺失,而 不是替换。
新升级让性能全面提升
去年底发布的 Titanium 系列试剂,是对现有 GS FLX平台的重要升级。升级内容包含耗材、试 剂和软件。 你无需对仪器的硬件做任何昂贵的升级, 只改进试剂和软件, 就能立刻实现性能提升。 升级之后,每轮测序能产生 100万个读长片段,高质量(Q20)的读长增加至 400 bp。第 400个碱基的准确率是 99%,之前的更高。通量也提高了 5倍,目前每轮运行能获得 4-6亿个碱基 对,所需时间为 10小时。
PTP 平板的创新重设计 重新设计之后, PTP 平板上孔的密度更高,利用更小的 DNA 捕获磁珠进行金属覆盖,改善了信号质量,因此读长的数量和长度都明显改善,同时准确性更 高。目前孔的直径是 29 um, DNA 捕获磁珠的大小是 20 um。
改进的测序试剂 改进的 GS FLX Titanium试剂显著降低了背景噪音,因此在几乎相同 的运行时间内,读长更加长。
升级的软件 优化用于超高通量测序的软件,能轻松对更大、更复杂的基因组进行拼接 和作图。
GS FLX 2.0版 它与以前版本的输出数据也完全兼容,让片段能够共同拼接和作图。 广阔的应用天地
在新一代测序技术中, GS 系统是最多产的。截至 2008年 9月,已经发表了 250多篇高质量的 paper 。 其中 Nature 20篇、 Science 13篇、 Cell 6篇、 Genome Research 20篇、 PNAS 24篇。 光是这些数据就让人咂舌。这些研究跨越了测序应用的多个方面:82篇全基因组测序论文包括 比较基因组学的从头测序和重测序; 54篇小分子 RNA 研究; 37篇聚焦快速兴起的宏基因组学; 27篇关于转录组图谱分析, 包括全转录组拼接和表达图谱; 13篇研究染色体结构和表观遗传学; 10篇有关稀有变异检测的超深度测序这个新领域; 11篇研究古老 RNA 。其余的文章关注 454测序系统的技术和生物信息学。多种多样的应用彰显出 454测序系统的能力,那些传统意义上 无法用测序来解决的问题现在也一并解决了。
454测序系统除了为多项研究领域开辟了基因组分析之路, 同时也加速了探索的步伐。 一般来说, 研究、分析、撰写并提交论文,经同行评议后发表,需要一年左右的时间。而利用 Genome Sequencer 系统发表论文的速度,显然表明 454测序结果的数据质量高,且分析简单。超长读 长与易用的分析工具相结合, 让研究人员能更集中精力于科学研究, 而不是研究测序过程中的某 个技术细节。这样研究项目能快速完成,接着踏上新的研究道路。
与其他新一代测序平台相比, 454平台的突出优势是读长。 目前 GS FLX系统的序列读长已超过 400 bp。虽然 454平台的测序成本比其他平台要高很多,不过对于那些需要长读长的应用,如 从头拼接和宏基因组学,它仍是最理想的选择。
去年底,美国加利福尼亚大学的研究小组利用全新的 GS FLX Titanium系列试剂对海洋样品的 宏基因组进行测序, 发现了一种全新的蓝藻物种, 文章发表在 11月 14日的 《 Science 》 杂志上。 这项研究是系统升级后发表的首篇文章。 首席研究员 Jonathan Zehr对于获得数据及分析结果的 速度非常震惊。他表示:“ 多年来我们一直试图培养这种微生物,但都没有成功。有了 GS FLX Titanium ,我们在几天之内就通过单次测序运行,从环境样品直接获得了宝贵的基因组信息。这 个系统超长的读长对于我们从复杂的微生物群体中鉴定并分析这种独特的细菌基因组来说非常 关键。 ”
最近,在 454测序平台的协助下,研究人员完成了油棕榈的全基因组测序、拼接和注释。油棕 榈是一种重要的经济作物, 它的基因组很大, 达 17 GB。 基因组的测序工作是由 GS FLX Titanium系统完成的, 拼接和分析则是由马来西亚一家生物信息学公司完成的。 值得注意的是, 这是史上 第一次在没有添加传统 Sanger 测序数据的情况下, 完成了对大且非常复杂的植物基因组进行从 头拼接。这种快速经济的方法为了解多种经济作物的遗传结构打开了大门。
此外,罗氏旗下的另一家公司 NimbleGen 正在全球性地捕获定向重测序市场。 NimbleGen 序列 捕获芯片与 454的测序仪结合,能让完整的人外显组测序成为现实,最终将为研究流水线输送 技术,并促进个性化医疗的开发 .
ABI 测序仪
过去 20年,美国应用生物系统公司(ABI )在测序方面一直占据着垄断地位。自公司的共同创 始人 Leroy Hood在上世纪 80年代中期设计了第一台自动荧光测序仪之后,生命科学研究就摆 脱了手工测序的繁琐和辛劳, 骄傲地迈入自动测序的新时代。 直到 2005年, 454推出了 FLX 焦 磷酸测序平台, ABI 的领先地位开始有些动摇。之后, ABI 迅速收购了一家测序公司
—— Agencourt Personal Genomics, 并在 2007年底推出了 SOLiD 新一代测序平台。 从 SOLiD 到如今的 SOLiD 3,短短一年多时间,它已经上演了一出精彩的 “ 一级方程式赛车 ” 。
SOLiD 全称为 supported oligo ligation detetion,它的独特之处在于以四色荧光标记寡核苷酸的 连续连接合成为基础,取代了传统的聚合酶连接反应,可对单拷贝 DNA 片段进行大规模扩增和 高通量并行测序。 就通量而言, SOLiD 3系统是革命性的, 目前 SOLiD 3单次运行可产生 50GB 的序列数据,相当于 17倍人类基因组覆盖度。而其无以伦比的准确性、系统可靠性和可扩展性 更让它从其他新一代测序平台中脱颖而出。为什么 SOLiD 能轻松实现貌似不可能的任务?让生 物通带你从测序原理入手,一探究竟。
SOLiD 工作流程
a. 文库制备
SOLiD 系统能支持两种测序模板:片段文库 (fragment library)或配对末端文库 (mate-paired library)。使用 哪一种文库取决于你的应用及需要的信息。片段文库就是将基因组 DNA 打断,两头加上接头,制成文库。 如果你想要做转录组测序、 RNA 定量、 miRNA 探索、重测序、 3’, 5’ -RACE 、甲基化分析、 ChIP 测序等, 就可以用它。如果你的应用是全基因组测序、 SNP 分析、结构重排 /拷贝数,则需要用配对末端文库。配对 末端文库是将基因组 DNA 打断后, 与中间接头连接, 再环化,然后用 EcoP15酶切, 使中间接头两端各有 27bp 的碱基,再加上两端的接头,形成文库。
b. 乳液 PCR/微珠富集
在微反应器中加入测序模板、 PCR 反应元件、微珠和引物,进行乳液 PCR (Emulsion PCR)。 PCR 完成 之后,变性模板,富集带有延伸模板的微珠,去除多余的微珠。微珠上的模板经过 3’ 修饰,可以与玻片共 价结合。看到这里,是不是有一种似曾相识的感觉呢?那就对了,此步骤与 454的 GS FLX基本相同。不 过 SOLiD 系统的微珠要小得多,只有 1 um。
乳液 PCR 最大的特点是可以形成数目庞大的独立反应空间以进行 DNA 扩增。其关键技术是 “ 注水到油 ” , 基本过程是在 PCR 反应前,将包含 PCR 所有反应成分的水溶液注入到高速旋转的矿物油表面,水溶液瞬 间形成无数个被矿物油包裹的小水滴。 这些小水滴就构成了独立的 PCR 反应空间。 理想状态下, 每个小水 滴只含一个 DNA 模板和一个 P1磁珠,由于水相中的 P2引物和磁珠表面的 P1引物所介导的 PCR 反应, 这个 DNA 模板的拷贝数量呈指数级增加, PCR 反应结束后, P1磁珠表面就固定有拷贝数目巨大的同来源 DNA 模板扩增产物。
c. 微珠沉积
3’ 修饰的微珠沉积在一块玻片上。在微珠上样的过程中,沉积小室将每张玻片分成 1个、 4个或 8个测序 区域。 SOLiD 系统最大的优点就是每张玻片能容纳更高密度的微珠,在同一系统中轻松实现更高的通量。
d. 连接测序
这一步可就是 SOLiD 的独门秘笈了。它的独特之处在于没有采用惯常的聚合酶,而用了连接酶。 SOLiD 连接反应的底物是 8碱基单链荧光探针混合物。连接反应中,这些探针按照碱基互补规则与单链 DNA 模 板链配对。探针的 5’ 末端分别标记了 CY5、 Texas Red、 CY3、 6-FAM 这 4种颜色的荧光染料。探针 3’ 端 1~5位为随机碱基, 可以是 ATCG 四种碱基中的任何一种碱基, 其中第 1、 2位构成的碱基对是表征探 针染料类型的编码区,下图的双碱基编码矩阵规定了该编码区 16种碱基对和 4种探针颜色的对应关系, 而 3~5位的 “n” 表示随机碱基, 6~8位的 “z” 指的是可以和任何碱基配对的特殊碱基。
单向 SOLiD 测序包括五轮测序反应, 每轮测序反应含有多次连接反应。 第一轮测序的第一次连接反应由连 接引物 “n” 介导,由于每个磁珠只含有均质单链 DNA 模板,所以这次连接反应掺入一种 8碱基荧光探针, SOLiD 测序仪记录下探针第 1、 2位编码区颜色信息,随后的化学处理断裂探针 3’ 端第 5、 6位碱基间的化 学键,并除去 6~8位碱基及 5’ 末端荧光基团,暴露探针第 5位碱基 5’ 磷酸,为下一次连接反应作准备。因 为第一次连接反应使合成链多了 5个碱基,所以第二次连接反应得到模板上第 6、 7位碱基序列的颜色信 息,而第三次连接反应得到的是第 11、 12位碱基序列的颜色信息 ……
几个循环之后,引物重置,开始第二轮的测序。由于第二轮连接引物 n-1比第一轮错开一位,所以第二轮 得到以 0, 1位起始的若干碱基对的颜色信息。五轮测序反应反应后,按照第 0、 1位,第 1、 2位 ... … 的 顺序把对应于模板序列的颜色信息连起来,就得到由 “0, 1, 2, 3…” 组成的 SOLiD 原始颜色序列。
e. 数据分析
SOLiD 测序完成后,获得了由颜色编码组成的 SOLiD 原始序列。理论上来说,按照 “ 双碱基编码矩阵 ” ,只 要知道所测 DNA 序列中任何一个位置的碱基类型,就可以将 SOLiD 原始颜色序列 “ 解码 ” 成碱基序列。但 由于双碱基编码规则中双碱基与颜色信息的简并特性(一种颜色对应 4种碱基对),前面碱基的颜色编码 直接影响紧跟其后碱基的解码,所以一个错误颜色编码就会引起 “ 连锁解码错误 ” ,改变错误颜色编码之后 的所有碱基。
和其它所有测序仪一样,测序错误在所难免,关键是对测序错误的评价和后续处理。由于 SOLiD 系统采用 了双碱基编码技术,在测序过程中对每个碱基判读两遍,从而减少原始数据错误,提供内在的校对功能。 这样,双保险确保了 SOLiD 系统原始碱基数据的准确度大于 99.94%,而在 15X 覆盖率时的准确度可以达 到 99.999%,是目前新一代基因分析技术中准确度最高的。
为避免 “ 连锁解码错误 ” 的发生, SOLiD 数据分析软件不直接将 SOLiD 原始颜色序列解码成碱基序列,而是 依靠 reference 序列进行后续数据分析。 SOLiD 序列分析软件首先根据 “ 双碱基编码矩阵 ” 把 reference 碱基
序列转换成颜色编码序列, 然后与 SOLiD 原始颜色序列进行比较, 来获得 SOLiD 原始颜色序列在 reference 的位置,及两者的匹配性信息。 Reference 转换而成的颜色编码序列和 SOLiD 原始序列的不完全匹配主要 有两种情况:“ 单颜色不匹配 ” 和 “ 两连续颜色不匹配 ” 。由于每个碱基都被独立地检测两次,且 SNP 位点将 改变连续的两个颜色编码,所以一般情况下 SOLiD 将单颜色不匹配处理成测序错误,这样一来, SOLiD 分析软件就完成了该测序错误的自动校正;而连续两颜色不匹配也可能是连续的两次测序错误, SOLiD 分 析软件将综合考虑该位置颜色序列的一致性及质量值来判断该位点是否为 SNP 。
在初步了解了 SOLiD 系统的工作原理之后,我们才能明白它的魅力所在。
系统可扩展性
SOLiD 系统采用开放玻片式的结构,使用包被 DNA 样品的微珠来输入基因组信息。微珠密度并不是一成 不变的,系统支持更高密度的微珠富集。开放式玻片形式、微珠富集、以及软件算法的结合,能使平台轻 松升级到更高的通量, 而无需对基础技术和配置做重大改变。 这也是 SOLiD 系统平均每季度将通量扩大一 倍的原因所在。
无以伦比的通量
目前 SOLiD 3系统单次运行能产生 50 GB的人基因组序列数据,相当于基因组的 17倍覆盖度,这显然是 其他任一台新一代测序系统都无法达到的。今年初, ABI 公司和贝勒医学院人类基因组测序中心(HGSC ) 的科学家总结了他们在千人基因组计划首次数据发布中的贡献。作为商业参与者以及与 HGSC 共同协作, ABI 公司利用 SOLiD 系统产生了超过 460 GB可作图的序列数据,比这两个机构的预定目标高出了 65%。 而通量的升高也有望进一步降低基因组测序的费用,成本只需 1万美元的人类基因组测序指日可待。
最大的灵活性
SOLiD 3系统具有两个独立的流动室, 让用户能在一台 SOLiD 分析仪中运行两个完全独立的实验 —— 同时 提供两套仪器。玻片也能分成 1个、 4个或 8个小室。而 20个条形码序列则提供了额外的灵活性,显著增 加了定向重测序、表达和 ChIP 分析的经济性。目前最多能同时运行 320个样品(2×8×20)。
至此, SOLiD 系统已不再是一台单纯的测序仪,而是成为功能更全面的基因分析仪。除了测序和重测序, 还能进行全基因表达图谱分析、 SNP 、 microRNA 、 ChIP 、甲基化等多种分析。
全基因表达图谱分析
芯片大概是目前应用最广泛的从全局角度分析基因表达整体模式的方法。然而,基于杂交技术的微阵列技 术只限用于已知序列,无法检测新的 mRNA ;而且杂交技术灵敏度有限,难以检测低丰度的目标(需要更 多的样品量),难以检测重复序列;也无法捕捉到目的基因表达水平的微小变化 ------而这恰恰是研究在刺 激下或环境变化时的生物反应所必需的。
与芯片技术相比,基于测序的高灵敏 SOLiD 技术可对单个细胞和癌症样品中存在的痕量 RNA 进行整体的 全基因组表达图谱分析,每次运行能定位高达 2亿 4千万个标签(mRNA 的相对表达水平可通过系统产生 的序列标签数目来计算) , 可检测低至每个细胞中 10-40pg 的总 RNA , 即使 mRNA 表达水平很低, SOLiD 系统也能够无偏向性地分析样品中存在的已知和未知 mRNA , 从而定量特定 mRNA 的差异表达模式。 起始 样品比微阵列技术要少得多,尤其适用于来源极为有限的生物样品分析,如癌症干细胞 ----分析其基因和非 编码 RNA 的表达图谱有助于有助于加速发掘潜在的生物标志物, 从而更准确区分不同的疾病类型以及识别 疾病易感性,帮助于研究人员更好地了解病变细胞的特性。
更多 RNA 研究
除了单细胞基因表达图谱分析, SOLiD 系统在 RNA 方面的其他应用还包括利用 SOLiD Small RNA Expression Kit来发现和筛选小分子 RNA ,实现在无需预先知道序列信息的情况下高通量发现新的 RNA 分子。 这个方案有望显著地提高研究人员鉴别小分子 RNA 的能力, 将过去不可能完成的实验变为可能。 目 前已发现的 microRNAs 还非常有限, SOLiD 可在不知道目标分子 DNA 序列的情况下进行检测和定量小的 RNA 分子,可将样品制备工作从常规方法的四天缩短为仅需一天,是分析在生物样品中表达的已知和未知 miRNA 及其它小分子 RNAs 的有效工具。利用 SOLiD Whole Transcriptome Kit还可以探索和鉴定全转录 本。 SOLiD 无可比拟的高通量和测序数据的高精确性使得可以用短序列读长即可测序整个转录组。了解转 录组对有助于解开导致复杂疾病的分子通路的秘密。这一系列应用补充使研究人员能在单个超高通量平台 上开展综合的 RNA 研究。
SNP 分析
尽管绝大多数的人类遗传信息在所有人中都相同,但是研究人员通常更感兴趣的是研究个体之间微小的遗 传差异。这种差异包括单碱基变异,以及被称为结构变异的各种较大片段 DNA 序列变异。结构变异包括 DNA 片段的插入、缺失、倒位和易位,结构变异的 DNA 片段范围可从几个碱基对到数百万个碱基对,可 能对基因产生重要影响,并导致人类疾病的发生。 SOLiD 流程获得的严密的片段范围,使研究人员可以鉴 别出很宽范围内的插入和缺失片段,结构重排也能很容易鉴别出来。这个平台的超高通量使研究人员可轻 而易举地获得高度基因组覆盖率的数据,精确鉴定个体基因组中存在的数百万个单碱基多态性 SNP ,揭示 大量此前未知、具有潜在医学价值的遗传变异,从而促进我们对正常 /疾病状态下 DNA 结构变异的了解, 以及在更高的分辨率下对结构变异进行深入分析,解释个体之间的易感性差异和对疾病治疗应答的差异, 最终实现个性化医疗。
甲基化分析
甲基化是自然发生的 DNA 化学修饰的一种。已知抑癌基因的失活与 DNA 序列特定区域的甲基化有关。而 去甲基化则可能导致基因组不稳定和表达模式变化。 DNA 甲基化区域可能作为基因在癌症过程中的标记。 研究人员一直致力研究从正常到癌变过程中甲基化模式如何变化的,原癌基因异常甲基化模式在癌变过程 中扮演怎样的角色。 SOLiD 系统运行通量非常惊人,很快就可以做多个样本全基因组甲基化模式检测,使 得研究人员可以鉴别基因组中对应元件的甲基化状态,从而帮助研究人员检测甲基化模式是否可以作为癌 症的生物标识,以及更好了解甲基化在癌变过程中扮演的角色。
范文三:Roche 454超高通量测序技术原理
Roche 454超高通量测序技术原理
2005年底,454公司推出了革命性的基于焦磷酸测序法的超高通量基因组测序系统——Genome Sequencer 20 System,被《Nature》杂志以里程碑事件报道,开创了边合成边测序的先河。2007年又推出了性能更优的第二代基因组测序系统——Genome Sequencer FLX System。2008年10月,454推出了全新的GS FLX Titanium系列试剂和软件,让GS FLX的通量一下子提高了5倍,准确性和读长也进一步提升。 GS FLX 测序原理
GS FLX系统的测序原理和GS 20一样,也是一种依靠生物发光进行DNA序列分析的新技术;在DNA聚合酶,ATP硫酸化酶,荧光素酶和双磷酸酶的协同作用下,将引物上每一个dNTP的聚合与一次荧光信号释放偶联起来 (图 1)。通过检测荧光信号释放的有无和强度,就可以达到实时测定DNA序列的目的。此技术不需要荧光标记的引物或核酸探针,也不需要进行电泳;具有分析结果快速、准确、灵敏度高和自动化的特点。 Roche GS FLX System是一种基于焦磷酸测序原理而建立起来的高通量基因组测序系统。在测序时,使用了一种叫做“Pico TiterPlate”(PTP)的平板,它含有160多万个由光纤组成的孔,孔中载有化学发光反应所需的各种酶和底物。测序开始时,放置在四个单独的试剂瓶里的四种碱基,依照T、A、C、G的顺序依次循环进入PTP板,每次只进入一个碱基。如果发生碱基配对,就会释放一个焦磷酸。这个焦磷酸在各种酶的作用下,经过一个合成反应和一个化学发光反应,最终将荧光素氧化成氧化荧光素,同时释放出光信号。此反应释放出的光信号实时被仪器配置的高灵敏度CCD捕获到。有一个碱基和测序模板进行配对,就会捕获到一分子的光信号;由此一一对应,就可以准确、快速地确定待测模板的碱基序列。
图1:GS FLX 高通量测序方法原理示意图
测序实验流程:
1、文库制备:根据样品的种类和实验目的,将基因组DNA/cDNA片段化处理至400-800bp间,经末端修复与特异性接头连接等修饰后变性处理回收单链的DNA(sstDNA);
2、Emulsion PCR:特定比例的单链DNA文库被固定在特别设计的DNA捕获磁珠上,使大部分磁珠磁珠携带了一个独特的单链DNA片断。磁珠结合的文库被扩增试剂乳化,形成油包水的混合物,每个独特的片断在自己的微反应器里进行独立的扩增,而不受其他的竞争性或者污染性序列的影响。整个片段文库的扩增平行进行。扩增后产生了几百万个相同的拷贝。随后,乳液混合物被打破,扩增后仍结合在磁珠上的片段既
可被回收纯化用于后续的测序实验;
3、测序反应:携带DNA的珠子与其他反应物混合物,随后放入PTP板中进行后继的测序。PTP孔的直径(29um)只能容纳一个珠子(20um)。然后将PTP板放置在GS FLX中,测序开始。每一个与模板链互补的核苷酸的添加都会产生化学发光的信号,并被CCD照相机所捕获;
4、数据分析:GS FLX系统在10小时的运行当中可获得100多万个读长,读取超过4-6亿个碱基信息,通过GS FLX系统提供两种不同的生物信息学工具对测序数据进行分析。
技术特点:
? 速度快,一个测序反应耗时10个小时,获得4-6亿个碱基对。比传统的Sanger测序的方法快100倍; ? 读长长,单个序列的读长更长,平均可达到450个碱基左右;
? 通量高,每个反应可以得到超过100万个序列读长,成本大大降低;
? 准确度高,读长超过400bp时,单一读长的准确性可以超过99%;
? 一致性好,测序结果一致性超过99.99%;
? 可以进行Pair,End测序研究;
? 简便高效,不需要进行建库、克隆挑取、质粒提取等工作,一个人可以在一天内完成一个微生物物种的测序工作。
GS FLX系统的应用
自从2005年底GS 超高通量基因组测序系统问世以来,已经相继在世界上各大测序实验室成功落户。这项技术的第一个“试验品”就是来自有“DNA之父”之称的James D Waston,他向454公司提供了自己的血液样本。目前GS系统的用户在Nature,Science,PNAS等世界顶级的期刊杂志上已经发表了五十多篇的学术论文。(详细列表请查询
https://www.roche-applied-science.com/sis/sequencing/genome/index.jsp)。与GS 20系统相比较,
硬件配置和软件系统方面的革新改进,使得GS FLX系统具有了广泛的应用: 全基因组测序
多达120 Mb的未知基因组的测序
,生成基因组结构概图
,研究DNA序列的组织,分布和信息
,基因筛查:寻找新基因,定位和功能
,和其他基因组进行比较研究
全基因组进行从头鸟枪法测序,例如微生物基因,BAC和YAC克隆测序。 比较基因组研究
,识别单碱基突变
,识别突变热点和保守区域
,识别插入或者缺失的基因
,断定基因型和表型之间的相关关系(比如,研究药物抗性的遗传基础) , 基于基因测序变化进行毒性预测
,进行流行病学分析
,了解工业生产菌株和它们的亲代菌株序列上的差异作为进行工业生产菌株开发的遗传基础
,进行宏基因组 (metagenomics)研究
,古代化石DNA 测序研究
利用配对末端方法(Pair-End Tag)将Contigs拼接成Scaffolds。
转录组和基因调节研究
基于短Tags,ESTs, ChIP,或者GIS-PET序列的高通量转录组分析,或者miRNA 序列的基因组范围识别,
小分子和非编码RNA的测序。
研究DNA的甲基化模式来进行基因调节的研究。
扩增产物分析
PCR产物的超精细测序(应用于医学研究的重测序)
,在混合的肿瘤样本中识别体细胞突变
,在群体水平上发现高可信度的SNP位点
范文四:454测序原理
454生命科学公司所研发的新一代测序平台基于光纤微流体技术和包裹了待测DNA片段的乳化液滴技术(炸药中的表面活性剂来维持乳液的热稳定性)。基于焦磷酸测序法的超高通量基因组测序系统——Genome Sequencer 20 System,被《Nature》杂志以里程碑事件报道,开创了边合成边测序(sequencing-by-synthesis)的先河。
GS FLX系统是一种依靠生物发光进行DNA序列分析的新技术:在DNA聚合酶,ATP硫酸化酶,荧光素酶和双磷酸酶的协同作用下,将引物上每一个dNTP的聚合与一次荧光信号释放偶联起来 (见下图)。通过检测荧光信号释放的有无和强度,就可以达到实时测定DNA序列的目的。此技术不需要荧光标记的引物或核酸探针,也不需要进行电泳;具有分析结果快速、准确、灵敏度高和自动化的特点。
454高通量测序方法原理示意图
优缺点:
1)454平台的突出优势是读长,每轮测序能产生100万个读长片段,读长可达到400-500bp;
2)通量为0.4-0.5Gb;
3)读出的片段较短,而且不能提供配对端点测序信息;
4)不需要任何克隆;但是这也造成了这一技术的一些缺陷:无克隆反应导致无法获得材料来覆盖序列缺口,而且在基因组测序完成过程中的一个重要部分就是补充低丰度区域。
应用:
包括基因组学的从头测序和重测序、小RNA的研究、转录图谱的分析以及染色体结构表观遗传学等
GS FLX系统的工作流程
GS FLX系统的流程概括起来,就是“一个片段 = 一个磁珠 = 一条读长(One fragment = One bead = One read)”。
1)样品输入并片段化:GS FLX系统支持各种不同来源的样品,包括基因组DNA、PCR产物、BAC、cDNA、小分子RNA等等。大的样品例如基因组DNA或者BAC等被打断成300-800 bp的片段;对于小分子的非编码RNA或者PCR扩增产物,这一步则不需要。短的PCR产物则可以直接跳到步骤3)。
2)文库制备:借助一系列标准的分子生物学技术,将A和B接头(3’和5’端具有特异性)连接到DNA片段上。接头也将用于后续的纯化,扩增和测序步骤。具有A、B接头的单链DNA片段组成了样品文库。
3)一个DNA片段=一个磁珠:单链DNA文库被固定在特别设计的DNA捕获磁珠上。每一个磁珠携带了一个独特的单链DNA片段。磁珠结合的文库被扩增试剂乳化,形成油包水的混合物,这样就形成了只包含一个磁珠和一个独特片段的微反应器。
4)乳液PCR扩增:每个独特的片段在自己的微反应器里进行独立的扩增,而没有其他的竞争性或者污染性序列的影响。整个片段文库的扩增平行进行。对于每一个片段而言,扩增后产生了几百万个相同的拷贝。随后,乳液混合物被打破,扩增的片段仍然结合在磁珠上。
5)一个磁珠=一条读长:携带DNA的捕获磁珠随后放入PTP板中进行后继的测序。PTP孔的直径(29um)只能容纳一个磁珠(20um)。然后将PTP板放置在GS FLX中,测序开始。放置在四个单独的试剂瓶里的四种碱基,依照T、
A、C、G的顺序依次循环进入PTP板,每次只进入一个碱基。如果发生碱基配对,就会释放一个焦磷酸。这个焦磷酸在ATP硫酸化酶和萤光素酶的作用下,经过一个合成反应和一个化学发光反应,最终将萤光素氧化成氧化萤光素,同时释放出光信号。此反应释放出的光信号实时被仪器配置的高灵敏度CCD捕获到。有一个碱基和测序模板进行配对,就会捕获到一分子的光信号;由此一一对应,就可以准确、快速地确定待测模板的碱基序列。这也就是大名鼎鼎的焦磷酸测序。
6)数据分析:GS FLX系统在10小时的运行当中可获得100多万个读长,读取超过4-6亿个碱基信息。GS FLX 系统提供两种不同的生物信息学工具对测序数据进行分析,适用于不同的应用:达400 MB的从头拼接和任何大小基因组的重测序。
GS FLX系统的准确率在99%以上。其主要限制来自同聚物,也就是相同碱基的连续掺入,如AAA或GGG。由于没有终止元件来阻止单个循环的连续掺入,
同
聚物的长度就需要从信号强度中推断出来。这个过程就可能产生误差。因此,454测序平台的主要错误类型是插入-缺失,而不是替换。
范文五:ILLUMINA_、454_、ABI_测序仪比较
Illumina 、454 、ABI 测序仪比较
Illumina 测序仪
Illumina公司的新一代测序仪Genome Analyzer最早由Solexa公司研发,利用其专利核心技术
”和“可逆性末端终结(reversible terminator)”,实现自动化样本制备及基因组数百万个“DNA簇
碱基大规模平行测序。Illumina公司于2007年花费6亿美金的巨资收购了Solexa,就是为了促成Genome Analyzer的商品化。Genome Analyzer作为新一代测序技术平台,具有高准确性,高通量,高灵敏度,和低运行成本等突出优势,可以同时完成传统基因组学研究(测序和注释)以及功能基因组学 (基因表达及调控,基因功能,蛋白/核酸相互作用)研究。 Genome Analyzer自上市以来,已经为千人基因组计划立下了赫赫战功。今年早期,荷兰科学家利用它首次绘出女性的基因组图谱。而就在前两周,《Nature》杂志上一连出现三个人类基因组图谱:炎黄一号-第一个亚洲人图谱;第一个癌症病人图谱;第一个非洲人图谱。它们全是依赖Genome Analyzer完成的。哗,一下就来仨~这和第一个人类基因组图谱的13年形成了多么鲜明的对照。
根据去年底的数据,Genome Analyzer已售出约200台,估计是市场占有率最广的。前不久,华大基因再添置了12台,准备放在香港和深圳的实验室,至此华大基因已经有29台Genome Analyzer。而著名的麻省理工学院和哈佛大学Broad研究院拥有47台Illumina测序仪。众多实验室之所以选择Illumina,看中的无疑是Genome Analyzer的高性价比。
上个月,Illumina将Genome Analyzer II升级到Genome Analyzer IIx,距年底实现单次运行获得95 GB数据的宏伟目标又近了一步。Genome Analyzer IIx有两个核心特征:其一是更大的试剂冷却器,支持超过100个测序循环,进一步提升了系统的易用性和自动化;其二是全新的流动池支架,让每轮运行所得的高质量数据增加20%。依靠系统软件和试剂的改进,Genome Analyzer IIx现在能够支持100 bp以上的配对末端读长,并在每次运行中产生超过20 GB的高质量数据。
Genome Analyzer技术的基本原理:
1. 文库制备
将基因组DNA打成几百个碱基(或更短)的小片段,在片段的两个末端加上接头(adapter)。 2. 产生DNA簇
利用专利的芯片,其表面连接有一层单链引物,DNA片段变成单链后通过与芯片表面的引物碱基互补被一端“固定”在芯片上。另外一端(5’或3’)随机和附近的另外一个引物互补,也被“固定”住,形成“桥 (bridge) “。反复30轮扩增,每个单分子得到了1000倍扩增,成为单克隆DNA簇。DNA簇产生之后,扩增子被线性化,测序引物随后杂交在目标区域一侧的通用序列上。
3. 测序
Genome Analyzer系统应用了边合成边测序(Sequencing By Synthesis)的原理。加入改造过的DNA聚合酶和带有4种荧光标记的dNTP。 这些核苷酸是“可逆终止子”,因为3’羟基末端带有可化学切割的部分,它只容许每个循环掺入单个碱基。此时,用激光扫描反应板表面,读取每条模板序列第一轮反应所聚合上去的核苷酸种类。之后,将这些基团化学切割,恢复3'端粘性,继续聚合第二个核苷酸。如此继续下去,直到每条模板序列都完全被聚合为双链。这样,统计每轮收集到的荧光信号结果,就可以得知每个模板DNA片段的序列。目前的配对末端读长可达到2×50 bp,更长的读长也能实现,但错误率会增高。读长会受到多个引起信号衰减的因素所影响,如荧光标记的不完全切割。
4. 数据分析
自动读取碱基,数据被转移到自动分析通道进行二次分析。
Genome Analyzer系统之所以如此畅销,关键在于其技术上的优势。
1. 可扩展的超高通量
Genome Analyzer系统目前每次运行后可获得超过20 GB的高品质过滤数据。这个技术的可扩展性保证了更高的数据密度和输出,能用更少的经费完成更复杂的项目。到今年底,通量还有望上升到95 GB,相当于人类基因组的30倍覆盖度。
2. 需要样品量少
Genome Analyzer系统需要的样品量低至100ng,能应用在很多样品有限的实验(比如免疫沉淀、显微切割等)中。这也是很多研究人员所考虑的因素。
3. 简单、快速、自动化
Genome Analyzer系统提供了最简单和简洁的工作流程。即使是最小的实验室也能像大型基因
组中心一样进行大规模的实验。制备样品文库可以在几小时内完成,一个星期内就能得到高精确度的数据。Cluster Station可以说是Genome Analyzer的核心。由独立软件控制的自动生成DNA簇的过程可以在5小时之内(30分钟手工操作)完成。这个自动化的流程不需要进行Emulsion PCR,减少了手工操作误差和污染可能性,也不需要机器人操作或洁净室。快速的实验流程使Genome Analyzer的能力增至最大,而自动化步移降低了项目的时间和费用。 4. 新颖的测序化学技术
Genome Analyzer通过合成测序来支持大规模并行测序。利用新颖的可逆荧光标记终止子,可以在DNA链延伸的过程中检测单个碱基掺入。由于四个可逆终止子dNTP在每个测序循环都存在,自然的竞争减少了掺入的误差。
5. 单个或配对末端支持
Genome Analyzer系统支持单个片段或配对末端文库。文库构建过程简单,减少了样品分离和制备的时间。制备基因组DNA的单个片段或配对末端文库需要6个小时,只有3个小时需要手工操作。2×50个碱基或更长的读长增加了比对基因组的能力,并拓展了在其他方面的应用。 然而,精明的用户更看重的是性价比,这也是他们选择Illumina的重要原因。Illumina的售价约为45万美元,低于454 GS FLX的50万和SOLiD系统的59万(以上皆为美国的售价)。此外,运行成本也是一个关键因素。美国凤凰城翻译基因组学研究院(TGen)的主管David Duggan曾表示,当年购买新一代测序仪时,每次运行的费用就成为他下决定的主要因素。他最终选择了Illumina Genome Analyzer,因为每轮的运行费用为3000-4000美元(2007年的数据),较为合理,而其他测序仪可能更高。当然,他也综合考虑了通量、运行时间和样品量。 弗吉尼亚联邦大学的高原(音译)博士认为:“Genome Analyzer的操作费用、易用性和可扩展性让我实现了大规模基因组实验。现在,我的小型实验室正在进行过去只能在大型基因组中心才能完成的实验。低样品需求、简单的流程、高质量的数据以及应用灵活性让Illumina Genome Analyzer从其他高通量测序技术中脱颖而出。”
ROCH-454 测序仪
454公司可谓新一代测序技术的奠基人。2005年底,454公司推出了革命性的基于焦磷酸测序法的超高通量基因组测序系统——Genome Sequencer 20 System,被《Nature》杂志以里程碑事件报道,开创了边合成边测序(sequencing-by-synthesis)的先河。之后,454公司被罗氏诊断公司以1.55亿美元收购。一年后,他们又推出了性能更优的第二代基因组测序系统—— Genome Sequencer FLX System (GS FLX)。去年10月,全新的GS FLX Titanium系列试剂和软件的补充,让GS FLX的通量一下子提高了5倍,准确性、读长也进一步提升。 想当年,GS 20的出现,揭开了测序历史上崭新的一页。Jonathan Rothberg博士就是大规模并行测序的发明者,同时也是454的创始人。上世纪90年代,很多学者也都想到了大规模并行测序,他们试图将Sanger测序移到芯片上,但都以失败告终,因为这项技术没有可扩展性。1999年,Rothberg的儿子出世,他放了两个星期的陪产假。小家伙出生后被送入婴儿特护病房,
Rothberg非常担心,甚至想获取儿子的基因组信息。这段担惊受怕的经历给了他灵感,他突然意识到焦磷酸测序(pyrosequencing)不仅简单,而且具有可扩展性。两个星期之后,Rothberg就开始设计芯片和流动室,让测序在更小的反应室中进行,并同时进行几百万个反应。
硬件的设计和制造也只是成功的一半,在样品制备上还有同样漫长的路要走。Rothberg摒弃了传统的细菌克隆与挑选,将DNA打断成随机片段,并寻找一种方法来克隆每个片段。受到其他学者乳液实验的启发,他也想将DNA放入油包水的乳液中,这样就省去了反应管。一个好汉三个帮。在Joel Bader等人的帮助下,Rothberg验证了这些想法的可行性,并利用了炸药中的表面活性剂来维持乳液的热稳定性。就这样,乳液PCR终于诞生了。
之后,454生命科学公司用新一代测序仪对DNA双螺旋结构的发明者James Watson进行了基因组测序。第一份个人基因组图谱的绘制只用了两年时间,花费不到100万美元。虽然现在看来这并不算什么,但就当时而言,它相对于人类基因组计划已是质的飞跃。 GS FLX系统的工作流程
GS FLX系统的流程概括起来,就是“一个片段 = 一个磁珠 = 一条读长(One fragment = One
”。 bead = One read)
1)样品输入并片段化:GS FLX系统支持各种不同来源的样品,包括基因组DNA、PCR产物、BAC、cDNA、小分子RNA等等。大的样品例如基因组DNA或者BAC等被打断成300,800 bp的片段;对于小分子的非编码RNA或者PCR扩增产物,这一步则不需要。短的PCR产物则可以直接跳到步骤3)。
2)文库制备:借助一系列标准的分子生物学技术,将A和B接头(3’和5’端具有特异性)连接到DNA片段上。接头也将用于后续的纯化,扩增和测序步骤。具有A、B接头的单链DNA片段组成了样品文库。
3)一个DNA片段,一个磁珠:单链DNA文库被固定在特别设计的DNA捕获磁珠上。每一个磁珠携带了一个独特的单链DNA片段。磁珠结合的文库被扩增试剂乳化,形成油包水的混合物,这样就形成了只包含一个磁珠和一个独特片段的微反应器。
4)乳液PCR扩增:每个独特的片段在自己的微反应器里进行独立的扩增,而没有其他的竞争性或者污染性序列的影响。整个片段文库的扩增平行进行。对于每一个片段而言,扩增后产生了几百万个相同的拷贝。随后,乳液混合物被打破,扩增的片段仍然结合在磁珠上。
5)一个磁珠,一条读长:携带DNA的捕获磁珠随后放入PTP板中进行后继的测序。PTP孔的直径(29um)只能容纳一个磁珠(20um)。然后将PTP板放置在GS FLX中,测序开始。放置在四个单独的试剂瓶里的四种碱基,依照T、A、C、G的顺序依次循环进入PTP板,每次只进入一个碱基。如果发生碱基配对,就会释放一个焦磷酸。这个焦磷酸在ATP硫酸化酶和萤光素酶的作用下,经过一个合成反应和一个化学发光反应,最终将萤光素氧化成氧化萤光素,同时释放出光信号。此反应释放出的光信号实时被仪器配置的高灵敏度CCD捕获到。有一个碱基和测序模板进行配对,就会捕获到一分子的光信号;由此一一对应,就可以准确、快速地确定待测模板的碱基序列。这也就是大名鼎鼎的焦磷酸测序。
6)数据分析:GS FLX系统在10小时的运行当中可获得100多万个读长,读取超过4-6亿个碱基信息。GS FLX 系统提供两种不同的生物信息学工具对测序数据进行分析,适用于不同的应用:达400 MB的从头拼接和任何大小基因组的重测序。
GS FLX系统的准确率在99%以上。其主要限制来自同聚物,也就是相同碱基的连续掺入,如AAA或GGG。由于没有终止元件来阻止单个循环的连续掺入,同聚物的长度就需要从信号强度中推断出来。这个过程就可能产生误差。因此,454测序平台的主要错误类型是插入-缺失,而不是替换。
新升级让性能全面提升
去年底发布的Titanium系列试剂,是对现有GS FLX平台的重要升级。升级内容包含耗材、试剂和软件。你无需对仪器的硬件做任何昂贵的升级,只改进试剂和软件,就能立刻实现性能提升。升级之后,每轮测序能产生100万个读长片段,高质量(Q20)的读长增加至400 bp。第400个碱基的准确率是99%,之前的更高。通量也提高了5倍,目前每轮运行能获得4-6亿个碱基对,所需时间为10小时。
PTP平板的创新重设计 重新设计之后,PTP平板上孔的密度更高,利用更小的DNA捕获磁珠进行金属覆盖,改善了信号质量,因此读长的数量和长度都明显改善,同时准确性更高。目前孔的直径是29 um,DNA捕获磁珠的大小是20 um。
改进的测序试剂 改进的GS FLX Titanium试剂显著降低了背景噪音,因此在几乎相同的运行时间内,读长更加长。
升级的软件 优化用于超高通量测序的软件,能轻松对更大、更复杂的基因组进行拼接和作图。
GS FLX 2.0版 它与以前版本的输出数据也完全兼容,让片段能够共同拼接和作图。 广阔的应用天地
在新一代测序技术中,GS系统是最多产的。截至2008年9月,已经发表了250多篇高质量的paper。其中Nature 20篇、Science 13篇、Cell 6篇、Genome Research 20篇、PNAS 24篇。光是这些数据就让人咂舌。这些研究跨越了测序应用的多个方面:82篇全基因组测序论文包括比较基因组学的从头测序和重测序;54篇小分子RNA研究;37篇聚焦快速兴起的宏基因组学;27篇关于转录组图谱分析,包括全转录组拼接和表达图谱;13篇研究染色体结构和表观遗传学;10篇有关稀有变异检测的超深度测序这个新领域;11篇研究古老RNA。其余的文章关注454测序系统的技术和生物信息学。多种多样的应用彰显出454测序系统的能力,那些传统意义上无法用测序来解决的问题现在也一并解决了。
454测序系统除了为多项研究领域开辟了基因组分析之路,同时也加速了探索的步伐。一般来说,研究、分析、撰写并提交论文,经同行评议后发表,需要一年左右的时间。而利用Genome Sequencer系统发表论文的速度,显然表明454测序结果的数据质量高,且分析简单。超长读长与易用的分析工具相结合,让研究人员能更集中精力于科学研究,而不是研究测序过程中的某个技术细节。这样研究项目能快速完成,接着踏上新的研究道路。
与其他新一代测序平台相比,454平台的突出优势是读长。目前GS FLX系统的序列读长已超过400 bp。虽然454平台的测序成本比其他平台要高很多,不过对于那些需要长读长的应用,如从头拼接和宏基因组学,它仍是最理想的选择。
去年底,美国加利福尼亚大学的研究小组利用全新的GS FLX Titanium系列试剂对海洋样品的宏基因组进行测序,发现了一种全新的蓝藻物种,文章发表在11月14日的《Science》杂志上。这项研究是系统升级后发表的首篇文章。首席研究员Jonathan Zehr对于获得数据及分析结果的速度非常震惊。他表示:“多年来我们一直试图培养这种微生物,但都没有成功。有了GS FLX Titanium,我们在几天之内就通过单次测序运行,从环境样品直接获得了宝贵的基因组信息。这个系统超长的读长对于我们从复杂的微生物群体中鉴定并分析这种独特的细菌基因组来说非常关键。”
最近,在454测序平台的协助下,研究人员完成了油棕榈的全基因组测序、拼接和注释。油棕榈是一种重要的经济作物,它的基因组很大,达17 GB。基因组的测序工作是由GS FLX Titanium系统完成的,拼接和分析则是由马来西亚一家生物信息学公司完成的。值得注意的是,这是史上第一次在没有添加传统Sanger测序数据的情况下,完成了对大且非常复杂的植物基因组进行从头拼接。这种快速经济的方法为了解多种经济作物的遗传结构打开了大门。 此外,罗氏旗下的另一家公司NimbleGen正在全球性地捕获定向重测序市场。NimbleGen序列捕获芯片与454的测序仪结合,能让完整的人外显组测序成为现实,最终将为研究流水线输送技术,并促进个性化医疗的开发.
ABI测序仪
过去20年,美国应用生物系统公司(ABI)在测序方面一直占据着垄断地位。自公司的共同创始人Leroy Hood在上世纪80年代中期设计了第一台自动荧光测序仪之后,生命科学研究就摆脱了手工测序的繁琐和辛劳,骄傲地迈入自动测序的新时代。直到2005年,454推出了FLX焦磷酸测序平台,ABI的领先地位开始有些动摇。之后,ABI迅速收购了一家测序公司——Agencourt Personal Genomics,并在2007年底推出了SOLiD 新一代测序平台。从SOLiD到如今的SOLiD 3,短短一年多时间,它已经上演了一出精彩的“一级方程式赛车”。 SOLiD全称为supported oligo ligation detetion,它的独特之处在于以四色荧光标记寡核苷酸的连续连接合成为基础,取代了传统的聚合酶连接反应,可对单拷贝DNA片段进行大规模扩增和高通量并行测序。就通量而言,SOLiD 3系统是革命性的,目前SOLiD 3单次运行可产生50GB的序列数据,相当于17倍人类基因组覆盖度。而其无以伦比的准确性、系统可靠性和可扩展性更让它从其他新一代测序平台中脱颖而出。为什么SOLiD能轻松实现貌似不可能的任务,让生物通带你从测序原理入手,一探究竟。
SOLiD工作流程
a. 文库制备
SOLiD系统能支持两种测序模板:片段文库(fragment library)或配对末端文库(mate-paired library)。使用哪一种文库取决于你的应用及需要的信息。片段文库就是将基因组DNA打断,两头加上接头,制成文库。如果你想要做转录组测序、RNA定量、miRNA探索、重测序、3’, 5’-RACE、甲基化分析、ChIP测序等,就可以用它。如果你的应用是全基因组测序、SNP分析、结构重排/拷贝数,则需要用配对末端文库。配对末端文库是将基因组DNA打断后,与中间接头连接,再环化,然后用EcoP15酶切,使中间接头两端各有27bp的碱基,再加上两端的接头,形成文库。
b. 乳液PCR/微珠富集
在微反应器中加入测序模板、PCR反应元件、微珠和引物,进行乳液PCR(Emulsion PCR)。PCR完成之后,变性模板,富集带有延伸模板的微珠,去除多余的微珠。微珠上的模板经过3’修饰,可以与玻片共价结合。看到这里,是不是有一种似曾相识的感觉呢,那就对了,此步骤与454的GS FLX基本相同。不过SOLiD系统的微珠要小得多,只有1 um。
乳液PCR最大的特点是可以形成数目庞大的独立反应空间以进行DNA扩增。其关键技术是“注水到油”,基本过程是在PCR反应前,将包含PCR所有反应成分的水溶液注入到高速旋转的矿物油表面,水溶液瞬间形成无数个被矿物油包裹的小水滴。这些小水滴就构成了独立的PCR反应空间。理想状态下,每个小水滴只含一个DNA模板和一个P1磁珠,由于水相中的P2引物和磁珠表面的P1引物所介导的PCR反应,这个DNA模板的拷贝数量呈指数级增加,PCR反应结束后,P1磁珠表面就固定有拷贝数目巨大的同来源DNA模板扩增产物。
c. 微珠沉积
3’修饰的微珠沉积在一块玻片上。在微珠上样的过程中,沉积小室将每张玻片分成1个、4个或8个测序区域。SOLiD系统最大的优点就是每张玻片能容纳更高密度的微珠,在同一系统中轻松实现更高的通量。 d. 连接测序
这一步可就是SOLiD的独门秘笈了。它的独特之处在于没有采用惯常的聚合酶,而用了连接酶。SOLiD连接反应的底物是8碱基单链荧光探针混合物。连接反应中,这些探针按照碱基互补规则与单链DNA模板链配对。探针的5’末端分别标记了CY5、Texas Red、CY3、6-FAM这4种颜色的荧光染料。探针3’端1,5位为随机碱基,可以是ATCG四种碱基中的任何一种碱基,其中第1、2位构成的碱基对是表征探针染料类型的编码区,下图的双碱基编码矩阵规定了该编码区16种碱基对和4种探针颜色的对应关系,而3,5位的“n”表示随机碱基,6,8位的“z”指的是可以和任何碱基配对的特殊碱基。
单向SOLiD测序包括五轮测序反应,每轮测序反应含有多次连接反应。第一轮测序的第一次连接反应由连接引物“n”介导,由于每个磁珠只含有均质单链DNA模板,所以这次连接反应掺入一种8碱基荧光探针,SOLiD测序仪记录下探针第1、2位编码区颜色信息,随后的化学处理断裂探针3’端第5、6位碱基间的化学键,并除去6~8位碱基及5’末端荧光基团,暴露探针第5位碱基5’磷酸,为下一次连接反应作准备。因为第一次连接反应使合成链多了5个碱基,所以第二次连接反应得到模板上第6、7位碱基序列的颜色信息,而第三次连接反应得到的是第11、12位碱基序列的颜色信息……
几个循环之后,引物重置,开始第二轮的测序。由于第二轮连接引物n-1比第一轮错开一位,所以第二轮得到以0,1位起始的若干碱基对的颜色信息。五轮测序反应反应后,按照第0、1位,第1、2位... …的顺序把对应于模板序列的颜色信息连起来,就得到由“0,1,2,3…”组成的SOLiD原始颜色序列。
e. 数据分析
SOLiD测序完成后,获得了由颜色编码组成的SOLiD原始序列。理论上来说,按照“双碱基编码矩阵”,只要知道所测DNA序列中任何一个位置的碱基类型,就可以将SOLiD原始颜色序列“解码”成碱基序列。但由于双碱基编码规则中双碱基与颜色信息的简并特性(一种颜色对应4种碱基对),前面碱基的颜色编码直接影响紧跟其后碱基的解码,所以一个错误颜色编码就会引起“连锁解码错误”,改变错误颜色编码之后的所有碱基。
和其它所有测序仪一样,测序错误在所难免,关键是对测序错误的评价和后续处理。由于SOLiD系统采用了双碱基编码技术,在测序过程中对每个碱基判读两遍,从而减少原始数据错误,提供内在的校对功能。这样,双保险确保了SOLiD系统原始碱基数据的准确度大于99.94%,而在15X覆盖率时的准确度可以达到99.999%,是目前新一代基因分析技术中准确度最高的。
为避免“连锁解码错误”的发生,SOLiD数据分析软件不直接将SOLiD原始颜色序列解码成碱基序列,而是依靠reference序列进行后续数据分析。SOLiD序列分析软件首先根据“双碱基编码矩阵”把reference碱基
序列转换成颜色编码序列,然后与SOLiD原始颜色序列进行比较,来获得SOLiD原始颜色序列在reference的位置,及两者的匹配性信息。Reference转换而成的颜色编码序列和SOLiD原始序列的不完全匹配主要有两种情况:“单颜色不匹配”和“两连续颜色不匹配”。由于每个碱基都被独立地检测两次,且SNP位点将改变连续的两个颜色编码,所以一般情况下SOLiD将单颜色不匹配处理成测序错误,这样一来,SOLiD分析软件就完成了该测序错误的自动校正;而连续两颜色不匹配也可能是连续的两次测序错误,SOLiD分析软件将综合考虑该位置颜色序列的一致性及质量值来判断该位点是否为SNP。
在初步了解了SOLiD系统的工作原理之后,我们才能明白它的魅力所在。
系统可扩展性
SOLiD系统采用开放玻片式的结构,使用包被DNA样品的微珠来输入基因组信息。微珠密度并不是一成不变的,系统支持更高密度的微珠富集。开放式玻片形式、微珠富集、以及软件算法的结合,能使平台轻松升级到更高的通量,而无需对基础技术和配置做重大改变。这也是SOLiD系统平均每季度将通量扩大一倍的原因所在。
无以伦比的通量
目前SOLiD 3系统单次运行能产生50 GB的人基因组序列数据,相当于基因组的17倍覆盖度,这显然是其他任一台新一代测序系统都无法达到的。今年初,ABI公司和贝勒医学院人类基因组测序中心(HGSC)的科学家总结了他们在千人基因组计划首次数据发布中的贡献。作为商业参与者以及与HGSC共同协作,ABI公司利用SOLiD系统产生了超过460 GB可作图的序列数据,比这两个机构的预定目标高出了65%。而通量的升高也有望进一步降低基因组测序的费用,成本只需1万美元的人类基因组测序指日可待。 最大的灵活性
SOLiD 3系统具有两个独立的流动室,让用户能在一台SOLiD分析仪中运行两个完全独立的实验——同时提供两套仪器。玻片也能分成1个、4个或8个小室。而20个条形码序列则提供了额外的灵活性,显著增加了定向重测序、表达和ChIP分析的经济性。目前最多能同时运行320个样品(2×8×20)。 至此,SOLiD系统已不再是一台单纯的测序仪,而是成为功能更全面的基因分析仪。除了测序和重测序,还能进行全基因表达图谱分析、SNP、microRNA、ChIP、甲基化等多种分析。
全基因表达图谱分析
芯片大概是目前应用最广泛的从全局角度分析基因表达整体模式的方法。然而,基于杂交技术的微阵列技术只限用于已知序列,无法检测新的mRNA;而且杂交技术灵敏度有限,难以检测低丰度的目标(需要更多的样品量),难以检测重复序列;也无法捕捉到目的基因表达水平的微小变化------而这恰恰是研究在刺激下或环境变化时的生物反应所必需的。
与芯片技术相比,基于测序的高灵敏SOLiD技术可对单个细胞和癌症样品中存在的痕量RNA进行整体的全基因组表达图谱分析,每次运行能定位高达2亿4千万个标签(mRNA的相对表达水平可通过系统产生的序列标签数目来计算),可检测低至每个细胞中10-40pg的总RNA,即使mRNA表达水平很低,SOLiD系统也能够无偏向性地分析样品中存在的已知和未知mRNA,从而定量特定mRNA的差异表达模式。起始样品比微阵列技术要少得多,尤其适用于来源极为有限的生物样品分析,如癌症干细胞----分析其基因和非编码RNA的表达图谱有助于有助于加速发掘潜在的生物标志物,从而更准确区分不同的疾病类型以及识别疾病易感性,帮助于研究人员更好地了解病变细胞的特性。
更多RNA研究
除了单细胞基因表达图谱分析,SOLiD系统在RNA方面的其他应用还包括利用SOLiD Small RNA Expression Kit来发现和筛选小分子RNA,实现在无需预先知道序列信息的情况下高通量发现新的RNA分子。这个方案有望显著地提高研究人员鉴别小分子RNA的能力,将过去不可能完成的实验变为可能。目前已发现的microRNAs还非常有限,SOLiD可在不知道目标分子DNA序列的情况下进行检测和定量小的RNA分子,可将样品制备工作从常规方法的四天缩短为仅需一天,是分析在生物样品中表达的已知和未知miRNA及其它小分子RNAs的有效工具。利用SOLiD Whole Transcriptome Kit还可以探索和鉴定全转录本。SOLiD无可比拟的高通量和测序数据的高精确性使得可以用短序列读长即可测序整个转录组。了解转录组对有助于解开导致复杂疾病的分子通路的秘密。这一系列应用补充使研究人员能在单个超高通量平台上开展综合的RNA研究。
SNP分析
尽管绝大多数的人类遗传信息在所有人中都相同,但是研究人员通常更感兴趣的是研究个体之间微小的遗传差异。这种差异包括单碱基变异,以及被称为结构变异的各种较大片段DNA序列变异。结构变异包括DNA片段的插入、缺失、倒位和易位,结构变异的DNA片段范围可从几个碱基对到数百万个碱基对,可能对基因产生重要影响,并导致人类疾病的发生。SOLiD流程获得的严密的片段范围,使研究人员可以鉴别出很宽范围内的插入和缺失片段,结构重排也能很容易鉴别出来。这个平台的超高通量使研究人员可轻而易举地获得高度基因组覆盖率的数据,精确鉴定个体基因组中存在的数百万个单碱基多态性SNP,揭示大量此前未知、具有潜在医学价值的遗传变异,从而促进我们对正常/疾病状态下DNA结构变异的了解,以及在更高的分辨率下对结构变异进行深入分析,解释个体之间的易感性差异和对疾病治疗应答的差异,最终实现个性化医疗。
甲基化分析
甲基化是自然发生的DNA化学修饰的一种。已知抑癌基因的失活与DNA序列特定区域的甲基化有关。而去甲基化则可能导致基因组不稳定和表达模式变化。DNA甲基化区域可能作为基因在癌症过程中的标记。研究人员一直致力研究从正常到癌变过程中甲基化模式如何变化的,原癌基因异常甲基化模式在癌变过程中扮演怎样的角色。SOLiD系统运行通量非常惊人,很快就可以做多个样本全基因组甲基化模式检测,使得研究人员可以鉴别基因组中对应元件的甲基化状态,从而帮助研究人员检测甲基化模式是否可以作为癌症的生物标识,以及更好了解甲基化在癌变过程中扮演的角色。
转载请注明出处范文大全网 » 454测序技术服务(第二代测