来宝网Logo

热门词:生物显微镜 水质分析仪 微波消解 荧光定量PCR 电化学工作站 生物安全柜

现在位置首页>技术资料首页>行业动态>行业动态>2007年测序市场大打并购战

2007年测序市场大打并购战

Bio?IT World2010年9月7日 9:30 点击:2205


 

2007年5月,Craig Venter接受了节目主持人Stephen Colbert的采访:“是什么让你认为自己在生命科学和遗传领域能做得比上帝更好。” Venter回道:“因为我们有计算机。”这个回答让Colbert一时语塞。
如果7年前在Celera基因组研究和人类基因组计划中,计算机就已经成为关键因素,那么现在它们将背负更大的责任。从癌症突变分类到整个基因组相关研究,从进化基因组学到Venter的全球大样本考察,基因组分析从来没有如此宏伟和惊心动魄。但是直到最近大多数研究仍然依靠久经考验且精确的Sanger测序。
自从2005年首次引进新一代测序平台,454生命科学公司开始被推入基因组X奖角逐的首发位置。在过去的12个月里,454公司、Solexa公司和Agencourt私人基因组学公司(APG)分别被罗氏、Illumina和应用生物系统公司收购。其他竞争者还包括Helicos生命科学公司、VisiGen生物技术以及GE公司,等等,他们盯上了价值超过10亿美元的潜在巨大市场,虽然人类基因组测序的成本在持续下降,目前已降到100万美元左右,未来一两年内我们将可能看到基因组测序的费用在1万美元甚至更低。
长度问题
今年3月,罗氏向CuraGen公司支付了1.55亿美元的现金和股票收购的其控股的454公司,希望通过这一收购能巩固对未来454测序仪的使用权,并且将其发展成可以利用体外诊断应用工具。454公司推出的仪器曾在2005年被《Nature》杂志作为里程碑事件予以报道。此后454公司的多项工作在国际知名刊物上报道,包括尼安德塔人基因组开创性研究。与其他竞争者相同,454的技术平台将一条DNA片段与一个微珠结合,利用PCR技术,每个微珠分别获得几百万DNA片段的拷贝。在微珠进入微滴度扳后,每个DNA碱基(A、C、T、G)在微板上被分别洗出,并边合成边测序。CCD摄像机记录了在焦磷酸测序反应中10万个微球同一时间添加的每一个碱基。
454的第二代基因组测序仪FLX在第一代基础上很多方面都作了改进,包括读取长度,从平均100个碱基提高到240个碱基。在最近一次CHL会议上,罗氏和454的员工集体穿着印有“Length Matters”字样的T恤衫。此外,454将每一轮读取的数量增加了一倍,从20万提高到40万。更重要的是,系统的精确度也大幅度提高。
“当系统刚开始运行时,454公开了它的错误率,大约为4%”,罗氏应用科学公司市场部经理Tim Harkins道,“目前我们在每轮读取250个碱基的基础上错误率下降到0.5%以下。但是可惜的是,市场仍然采信原来《Nature》文章中发表的数据。” 相对于错误率的降低客户更容易接受读取长度的增加。
虽然FLX的成本大约在50万美元,但是454尽可能的对目前客户进行升级,基本上提高了微流体技术并保留了原来的CCD摄像机。在圣地亚哥召开的CHI新一代测序会议上,研发副总裁Michael Egholm宣布利用GS FLX454平台已经完成了首个人基因组的测序。巧合的是,该DNA样本的提供者为双螺旋结构的发明人之一James Watson。虽然测序只是得到初步结果(只有3.5次覆盖)。Egholm表示,Watson的序列在50个已知的疾病基因上存在变异。
分析
与罗氏收购454公司的价格相比,去年Illumina公司虽然花费6.15亿美元的巨资收购Solexa公司就显得比较昂贵了,但还是物有所值。据Illumina英国研发副总裁Tony Smith提供的信息,在产品开发完成的早期阶段,在不到30天的时间里,Illumina就接到了40多个基因组分析的订单。在收购Solexa后,Illumina有能力提供基因组分析的各种工具,涵盖整个基因组相关研究,表达分析和测序。
虽然Illumina 1G分析仪应用于再测序与从头测序相比可读取的长度较短(已有参考标准),但Smith仍然为测序仪最初的广泛应用而欣喜。它们包括个体基因组测序,微生物基因组测序,个体基因组部分比较寻找疾病基因,研究蛋白因子调控基因表达的实际结合部位,等等。
此外,研究团队也在探索将Illumina的分析仪配置重头测序技术。尽管读取的长度较短,生物信息学家仍然在研究算法和其他方法进行重头组配。Smith认为Illumina能够产生廉价且丰富序列的原因在于Illumina有一批生物信息学家在探索利用短序列读取结合样本平台获得的配对读取使从头组配成为可能。(当读取的长度较短时,“配对末端”在基因组组配方面提供了更大的确定性。)
Smith认为关键问题是“量/质等式的重要性”。很多公司包括Illumina容易夸耀自己可以得到多少个GB碱基。“这不是所谓的1G分析仪,最后什么都没有得到,” Smith开玩笑道,“但真正重要的是从量上你能获得多少高品质的数据。我们可以得到大量的数据,我们还能得到90%以上高品质的数据。这意味着在过滤掉的数据里面,我们没有浪费很多。”
Smith继续说道:“我们数据的美妙之处在于针对每一次碱基判定有4次荧光强度测量。这意味着数据结构与Sanger毛细管测序相似。Illumina数据输出的质量度量方法也与Rhred Scores用于Sanger数据分析的方法相似。 所以人们可以将他们熟悉的工具用于我们数据分析。如果你想利用其他平台得到的数据,操作起来也很简单,只要将相关数据结构匹配,从毛细管仪器中获得的高质量碱基与Illumina设备中获得的高质量碱基等同。”
一级方程式
与此同时,今年夏天美国应用生物系统公司准备测试它昂贵的新载体。在CHI测序会议上,生物系统公司的经理Michael Rhodes承认应用生物系统公司起步较晚,但它的SOLiD系统将上演一场“一级方程式赛车”。在过去的20年里,应用生物系统公司在自动测序方面几乎占据垄断地位,公司的共同创始人Leroy Hood在20世纪80年代中期设计了第一台自动化荧光检测仪。
英国Wellcome Trust基金会Sanger研究所的创始人Andy Watson去年加入了应用生物系统公司任市场拓展和战略联盟部高级主管,他的目标是开发生物系统公司新一代测序策略。Watson道:“我们研究了40多个不同的公司和技术,最后决定APG技术是我们想要建立的下一轮业务。”2006年7月应用生物系统用1.2亿美元的价格从Beckman-Coulte公司购买了APG。
购买APG的初衷是因为技术已经从重头测序向再测序演变。“我们需要一个技术对基因组进行比较,研究可供参考的基因组,”Watson道,“这要求技术能达到非常高的精确度,能产生非常大的数据量,并且满足对读取长度的需要。”
Watson补充道:“我们在寻找可以检测大规模基因组重排、拷贝数变异体(CNV)、颠换等内容的技术。为了实现这些研究,这项技术需包含配对末端法。我们试图揣摩这个世界是如何变化的,然后研究所有这些技术,并确定了40家公司的技术能够满足这些需求,并且可交易,能与应用生物系统公司整合。”
两个比一个好
Kevin McKernan曾就任于Whitehead研究所基因组中心,2000年合作创立了Agencourt公司,Kevin McKernan目前是应用生物系统公司麻州Beverly科学部高级总监。他解释道:“支持寡核苷酸连接和检测(SOLiD)技术来源于很多技术。”
McKernan分析了8种处于不同装配和检测阶段的SOLiD仪器。在每个仪器旁边的板块上镌刻着著名女性先驱的姓名。她们包括Amelia (Earhart)、 Barbara (McClintock)、Rosalind (Franklin)和Florence (Nightingale)。
SOLiD测序的化学及读出过程与Sanger测序及其他边合成边测序方法不同。它利用连接酶而不是聚合酶读取序列。“这允许我们放入对再测序分析具有重要意义的错误纠错系统,尤其是癌症,” McKernan道,“当你想用较低的频率发现变异时,你就需要非常高的原始精确率。我们发现SOLiD技术的精确率比其他当前的新一代测序系统高10倍。”
此外SOLiD还有其他优势。“我们得到的微珠密度高于其他系统,” McKernan道。密度高意味着能得到更多的信息。事实上,每轮输出的数据达到甚至超过500mb。
SOLiD与其他系统一样采用4种荧光标记,它的独特之处在于精巧的基于2个碱基的读出系统,每个连接步骤都询问相邻的一对核苷酸。通过连接步骤的强化,每个碱基被询问2次。
利用彩色编码区分遗传变异,例如从随机测序错误中区分出SNP。的确,应用生物系统公司认为格式完美的简单可以改变序列分析的方式。Rhodes道:“我们与联合基因组研究所合作完成了一个再测序项目。在这个项目中同时产生了Sanger和SOLiD数据。我们将Sanger的数据改成彩色,这样就能利用SOLiD数据中采用的错误分析方法。”
McKernan补充道:“SOLiD系统的读出长度可能是所有系统中最长的,每轮读出的序列长度超过1亿碱基。这基本上与配对末端测序类似。”每家公司都在开发配对末端测序方法,在DNA重复序列丰富的区域进行定向组配。McKernan认为人基因组单次测序25mer只能组配80%的人基因组。“如果你能将它与数千个碱基距离之外的另外25mer碱基锚定,那么你能得到的组配高达93%~95%。如果单个25mer碱基在DNA重复区域内锚定失败,它的锚定配体碱基通常允许它安置在重复区内。”
SOLiD 存储
SOLiD仪器潜在的降价空间在于计算功率和存储所需的费用。整套SOLiD系统包括计算和工作流程部分,累计价格超过60万美元。
Rhodes解释道:“在仪器下有个计算机结点用于处理太字节的图像存储,此外还有其他一些部件实现工作流程的自动化。”实际上,这是一个10个双核CPU组成的Linux操作系统群(由戴尔在初步模型上提供),带有15TB的存储量。Rhodes解释道:“我们在计算机上实现所有操作,在图像获取的同时进行处理。在运行结束后的两三个小时内,我们将完成所有参考序列的校对,并允许网上下载。”(5年前,可列出前500强的超级计算机目录。)
Rhodes道:“没有人在Sanger图像较少的时候就开始储存,那么在它变多时,谁会去储存它呢?我们希望让你跳过图像直接进入数据分析。”
“相反,跑一轮典型的454FLX,在数据提取之后产生的琐碎的原始图像数据就高达13GB,即碱基判定,而我们最后得到的数据总量少于20GB。利用500GB的硬盘,这是非常容易处理的,”Harkins道,“压缩后能用一张DVD存储,你只需要花费几美元就可存下跑一轮仪器产生的数据。”
Harkins 发现其他新一代的测序平台运行一轮后往往产生TB量级的数据。“我们在讲推动科学的发展,但是其他公司目前面临一些困境,他们在计算机硬件上的花费高于运行仪器所需的试剂,” Harkins道。
Illumina公司的Smith对此表示认同:“真正大的数据是图像。” Illumina为客户提供储存所有图像的机会。“因为有些客户想要这些图像。问题是你每轮获得的图像数据可能是上百GB甚至1TB。而未来数据只会增不会减。客户可以出于质量控制目的存储一组图像,或储存一轮特别重要的图像并备份归档。”
对于市场,Harkins的问题是:“你想要保存所有的原始数据吗?454允许客户对他们的原始数据进行重新评价。”“我们有一个客户利用升级的GS FLX软件对他的原始数据进行了再加工,结果得到改善,”Harkins道,“当我们谈到错误率从1%~2%降低到0.5%时,可引起下游分析的明显改善。”
但Rhodes对此表示反对。仪器运转3天,每秒产生4Mb的数据,Rhodes 道:“客户需要的不是图像而是数据,他们真正需要的是结果。”
在CHI新一代测序会议小组讨论中,Rhodes道:“简单计算一下,如果你需要储存所有的图像数据,一周大约有6TB,这可能需要你花费100万美元用于存储、备份和材料。所以除非你想回顾每一张图像,否则重新做一遍实验可能或更便宜些。有一些情况可能需要保存所有图像,譬如非常珍贵的cDNA克隆,否则对于常规的工作是没有必要的。”
“即使你到了这个阶段,仍然有很大的数据集,如果你每轮产生10亿碱基,你最后得到的字节和碱基量仍然很大,”Smith道,“如果你不想处理TB数据,可以通过不储存图像把数据量减少到100GB左右。”Smith道:“很多客户都有必需的计算机设备,但是对于实验室采用这项技术,我们推荐使用8结点10TB硬盘容量的计算机。”这种类型的计算机是SGI公司所乐意供应的,其他公司还包括DNAStar。
但是Harking认为市场并没有遭遇需要支付一两万美元储存一台仪器跑一轮测序产生的数据这样的问题。“这将会把市场推入困境,”他说,“丢掉原始数据是一种思维转变,我不认为人们已经接受这种转变。”
发动你的引擎
应用生物系统公司可以想象在SOLiD仪器推出后进入该领域的机会,但是市场上还存在其他挑战。位于马萨诸塞州剑桥的Helicos BioSciences公司最近将原始股公开出售。该公司CEO Stanley Lapidus说公司计划于2007年年底推出Heliscope设备,设备推出后对一个人完整的基因组测序只需花费5,000美元。
2003年,包括Lapidus、Eric Lander和HHM斯坦福生物物理学家Stephen Quake在内的一个团队合作成立了Helicos公司。Helicos公司的“真正的单分子测序(tSMS)”平台是以Quake和他的同事2003年发表的技术为基础。该平台省略了扩增步骤,测序开始于大约12亿的单链模板,几百个碱基的长度,置于载玻片上,利用荧光脉冲检测出每一个新结合的碱基,计算机分析图像确定每条短链的序列。
Helicos公司在肿瘤再测序、转录图谱、甲基化和候选区域再测序中发现多血症。省略PCR扩增步骤可以减少错误的发生以及相移问题。HeliScope每天可以产生109个左右的碱基,在技术改进后可能达到每小时109个碱基。今年年初,Helicos宣称公司开发了新的碱基聚合酶成分可辅助高度重复DNA束的测序。Lapidus认为这是Helicos努力打造高性能单分子序列平台过程中的一项重要成绩。
在休斯顿,VisiGen公司的Susan Hardin正在进行第三代甚至第四代技术的开发,在未来几年里可能不会推出一套新的商业化设备。“我们的技术包括利用供体荧光基团修饰DNA多聚酶,将荧光基团放置在γ-磷酸基上。然后我们能实时监测聚合酶的工作,” Hardin道。但是她的目标是降低人基因组测序的费用,她说:“未来我们的人基因组测序费用是每天1,000美元,这是其他公司不能提供的。”
终点
这可能需要几年的时间,但是大部分新平台公司将成为Archon基因组学X奖的竞争者。1,000万美元奖金将授予第一家能在10天内测出100个人基因组序列的公司,一条序列1万美元(奖金的赞助者是发现世界第三钻石矿的加拿大地质科学家Stewart Blusson)。
但是专家和竞争者对终点的界定有些混乱。Harkins认为这是一个难题:“如果你研究公共区域,这当中有双重标准。公共区域参考序列不足以支撑当前定义的1万美元基因组X奖。你想要通过当前的公共参考基因组获得完整的基因组,但是当前的序列并不完整。然而我们赞同X奖的门槛应制定高一些,不仅仅勘测SNP,还应该包括所有的变异,例如结构变异。”
McKernan赞同道:“人基因组测序的目标应该超过当前输入Genebank中的人基因组的质量。没有方法确定谁是真正的赢家,除非几年后得到澄清,否则没有必要去想这些。”“我们目前要研究的是50至100万美元基因组范围,” Harkins道,“在达到1000万美元水平之前,我们还有许多工作要做。”
Watson表示应用生物系统公司希望在不同的市场区域取胜,在这些领域相信自己能赢,但不包括重头测序。Watson 道:“如果你想用500个碱基进行重头基因组研究,这就不是我们技术的长项。”
今天夏初,应用生物系统公司就通过合作伙伴加入竞争者队伍中,但是在2008年之前不会引入SOLiD。Rhodes并不在意对于滞后的批评:“2006年我们收购了APG公司,到今天我们已经做好准备,这是非常了不起的。”
Watson也驳回了应用生物系统公司应赶上节奏的建议:“我们在这项技术上的能力越来越强,在这之中我们付出了巨大的努力,明年的今天你们不会说应用生物系统公司还落在后面。”

(译自《Bio•IT World》)

(来源: Bio?IT World )


全年征稿 / 资讯合作

联系邮箱:kefu@labbase.net

版权与免责声明

  • 凡本网注明“来源:来宝网”的所有作品,版权均属于来宝网,转载请必须注明来宝网, http://www.labbase.net,违反者本网将追究相关法律责任。
  • 本网转载并注明自其它来源的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品来源,并自负版权等法律责任。
  • 如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。