当前位置:首页 > 技术交流 > 最新应用

技术交流

扫描二维码
或添加“GeneGroup003
获取更多更新资讯

商城订购

扫描二维码
或添加“基因商城(GeneMart)
手机下单,快人一步

售后服务

扫描二维码
或添加“GeneGroup005
获取更快速售后支持

重磅!高准确度长读长Iso-Seq实现对加州红杉的六倍体分型

版权所有,转载请联系基因市场部
2021-01-29

加州红杉全长转录本测序

2020年,PacBio在PAG(动植物基因组会议)大会上展示的最新的HiFi技术,引发了广泛的关注,同时科学研究者对PacBio SMRT测序技术在超大基因组组装方面的表现有了更高的期待。于是就有了后来广为人知的两周时间组装完成加州红杉27G超大基因组的壮举。在此之后,Elizabeth Tseng进一步对加州红杉进行全长转录本测序,揭示了这个超大基因组的复杂可变剪切,实现了超大基因组的六倍体分型。

图片

加州红杉,Sequoia sempervirens, 是地球上最高最古老的生物之一。它仅沿着太平洋沿岸的一小片土地生长,大部分在加利福尼亚州。树木高大宏伟,通常高达300英尺,基因组大小高达27G。


复杂的可变剪切

本次研究中,Iso-Seq文库构建和测序工作由美国特拉华大学DNA测序和基因分型中心完成,一共拿到530万全长转录本reads,比对到的转录本范围从50 bp到14.2 kb,平均长度为2.9 kb (Figure 1.)。虽然大多数基因座只有1-5个同工型,但许多位点显示出复杂的可变剪切模式,突出了全长转录本测序的功能(Figure 2a.)。

图片

Figure 1. Mapped redwood Iso-Seq transcript length distribution and isoform complexity


Iso-Seq数据一方面可以查看可变剪切的能力,另一方面可以直接根据序列预测ORF的能力。Figure 2b.中显示了一个非常有代表性的示例,基因PB.209显示了三个isoform,其中两个导致相同的ORF预测。BLASTN是针对“未知的mRNA”,但是当我使用预测的ORF进行BLASTP时,显示它与锌指蛋白的相似性高达50%。

图片

Figure 2. Iso-Seq mapping example. (a) BLASTN hits a predicted DEAD-box ATP-dependent RNA helicase 20-like transcript. (b) Alternative splicing at a putative zinc finger locus resulted in predicted ORF changes.

Iso-Seq可以实现六倍体分型?YES!!!

Figure 3. 显示了将phase基因组与phase转录组结合的来进行六倍体分型的案例。该基因座有六个基因组单倍体,但其中两个仅在非编码区有差异,因此IsoPhase仅报告了5个等位基因。并不是所有的IsoPhase基因座都看起来很清晰,因为Iso-Seq群集旨在识别可变剪切(外显子)级别的差异。

图片

Figure 3. IsoPhase showing 5 distinct alleles. (top track) genome haplotigs mapped back to the contig; (middle) Iso-Seq full-length reads grouped and colored by IsoPhase-inferred alleles; (bottom) Iso-Seq transcripts. Note that, while there are 6 genomic haplotigs, two alleles diverge only in SNPs in the non-coding region of this locus.

使用Iso-Seq评估基因组质量

为了寻找完全没有map到的基因或者缺失的基因,Liz T使用其自己开发的Cogent软件根据Iso-Seq转录本的k-mer相似性鉴定基因家族。确定基因家族之后,运行BLASTN来查看没有map或map不好的Iso-Seq基因家族是否在NR数据库有匹配。Figure 4.显示了一个Iso-Seq基因家族的例子,该家族包含两组转录本,间隔约300 kb。两组转录本均未完全map(soft-clipped at the end),并且对ATP依赖的解旋酶基因具有相同的BLASTN命中。基因组覆盖率显示该区域后半部分的覆盖率不均匀,表明存在潜在的组装问题。

图片

Figure 4. Using Cogent to identify partially mapped Iso-Seq gene families that could identify genome assembly issues. (top) Mapped coverage and alignment of genomic HiFi reads, which were input to the Hifiasm assembly (bottom) Mapping of Iso-Seq transcripts.



PacBio HiFi Reads

HiFi Reads是PacBio测序平台推出的兼顾长读长和高准确度的测序技术。作为PacBio最新的数据类型,既兼顾读长(20kb的长度)又具有高准确度(大于99%准确率)的HiFi reads,不仅可以改善变异检测,减少组装时间,并能够识别复杂的基因组区域的细微差别,有助于增加基因组组装的连续性,准确性和完整性,可以实现多倍体基因分型,发现更多更完整的转录本,挖掘更多生物学信息。


图片
图片

Iso-Seq

PacBio高准确度全长转录本测序Iso-Seq在RNA的相关研究方面,起到了重要的作用,具有不依赖于参考基因组,无需组装,直接反映了转录本亚型全貌的特点。Iso-Seq的数据可以多倍体物种进行分型分析,对于缺失的基因或者难以组装的基因可以通过Iso-Seq转录本进行组装,同时也可以对ORF进行预测。

图片

短读长测序需要通过组装,来拼凑isoform之后再做进一步的生信分析及数据挖掘


图片

PacBio HiFi reads 高准确度长读长Iso-Seq可以实现一条read即可覆盖完整的全长转录本isoform,避免组装过程中的错误及信息缺失

更多Iso-Seq资讯

0202年了,不会还不知道Iso-Seq全长转录本测序的价值吧?

PacBio Iso-Seq揭示NGS无法检测到的肿瘤转录组特征

习惯被忽略的Poly(A),悄悄成为高分文章的新阵地!

在线研讨会 | 心肌细胞死亡和心脏保护 —— CaMKII及其分子伴侣的故事

Iso-seq经典文献丨全长转录组测序揭示紫杉醇耐药型三阴乳腺癌的治疗新靶点

转载 2019盘点 | Iso-Seq技术主导发表的高颜值文章思路在此(内含搜索资源)

     参考

  1. A Genome Fit for a Giant Sequencing the California Redwood

  2. Decoding A Coastal Giant: Full-Length Transcriptome of Sequoia sempervirens

  3. 红杉Iso-Seq数据发布地址如下,供各位科学研究者参考和使用:https : //downloads.pacbcloud.com/public/dataset/redwood2020/isoseq/



为了更好的向您推送PacBio SMRT测序技术的最新进展,基因有限公司开辟了专门的企业微信账号,实时解读最新PacBio研究进展。

图片


长按并识别二维码并添加联系人,您将了解到有关高准确度长读长测序技术的最新进展,以及我们即将举办的线上线下活动。

      基因有限公司作为PacBio公司在中国区的独家代理商,自2011年以来将PacBio第三代单分子实时测序技术引入国内,一直为国内用户提供专业的三代测序系统的安装培训,技术支持,应用培训与售后维护工作,赢得客户的一致好评与信任。基因有限公司将一如既往的支持越来越多的PacBio用户。


欢迎关注我司“基因快讯”与“基因售后服务”官方微信

沪公网安备 31010402003540号

沪ICP备19021954号-2