介绍gydF4y2Ba

自2019年冠状病毒疾病的起源(COVID-19)大流行,严重急性呼吸系统综合症coronavirus-2 (SARS-CoV-2)迅速演变成七感兴趣的变体(VOI)和四个变异的担忧(VOC)gydF4y2Ba1gydF4y2Ba。此外,截至7月15日,2021年,超过2559000 SARS-CoV-2基因组序列已经存入公开基因库和全球共享禽流感数据项目(GISAID)数据库gydF4y2Ba2gydF4y2Ba。从现在的建立普遍D614G替换gydF4y2Ba3gydF4y2BaVOC的出现和VOI几十种不同的突变在各自的基因组gydF4y2Ba1gydF4y2Ba在整个大流行期间,SARS-CoV-2进化已经明显。定义这些进化事件,疾病控制和预防中心(CDC)分类某些血统VOC和VOI表示高度适应和免疫逃避的SARS-CoV-2基于专家评价SARS-CoV-2可用数据的跨部门小组(团体)gydF4y2Ba1gydF4y2Ba。最近,世界卫生组织(世卫组织)进一步给出自己的新兴SARS-CoV-2血统分类使用希腊字母的字母gydF4y2Ba4gydF4y2Ba。gydF4y2Ba

夏威夷ʻ我一直不成比例地受到COVID-19种族而言,其中20%的病例发生在太平洋岛民的4%的人口gydF4y2Ba5gydF4y2Ba,gydF4y2Ba6gydF4y2Ba。理解相关SARS-CoV-2新兴血统在夏威夷ʻ我,一个孤立的岛屿社区与多样的民族,将允许一个更大的理解全球大流行的自然。gydF4y2Ba

幸运的是,早在大流行,世界各地的政府和私营部门资源流入生产有效的疫苗。在美国,三种疫苗(辉瑞和BioNtech BNT162b2,现代化信使rna - 1273和詹森Ad26.COV2.S)授权并建议由美国食品和药物管理局(FDA)gydF4y2Ba7gydF4y2Ba,gydF4y2Ba8gydF4y2Ba。不幸的是,所有这些疫苗减少了对所有VOC功效gydF4y2Ba1gydF4y2Ba可能会进一步扩大,影响疫苗的病毒进化设计的原始菌株。损失的功效可以归因于免疫原性抗原表位的改变gydF4y2Ba9gydF4y2Ba。这些抗原决定基的改变也减少单克隆抗体的有效性gydF4y2Ba10gydF4y2Ba,gydF4y2Ba11gydF4y2Ba,gydF4y2Ba12gydF4y2Ba。几个发现这些突变的蛋白用于疫苗的设计,因此允许病毒逃避抗体针对原始菌株的疫苗。类似于年度流感病毒疫苗,SARS-CoV-2礼物的进化的困境如何重新设计下一代疫苗跟上病毒的进化。gydF4y2Ba

一个尝试匹配疫苗病毒的进化是现代化。为了应对B.1.351 VOC大大减少诺瓦瓦克斯公司的疫苗的功效gydF4y2Ba13gydF4y2Ba,现代化探索B.1.351 VOC序列的使用在他们的信使核糖核酸疫苗的设计gydF4y2Ba14gydF4y2Ba。幸运的是,新修改的疫苗增加中和B.1.351 VOC当作为助推器gydF4y2Ba15gydF4y2Ba。然而,B.1.351只有1.15%全世界普遍在2021年4月。因此,对新兴VOC连续临床试验评价是不切实际的匹配速度和多样性变异和VOC在世界范围内出现。gydF4y2Ba

回答的困境重新设计下一代SARS-CoV-2疫苗和预测人群中单克隆抗体的有效性,我们现在和进一步验证我们之前描述的定量分析gydF4y2Ba16gydF4y2Ba确定个体替换和删除和变异的出现,一样,作为一个算法。这个算法是一个平台监控病毒和确定适当的疫苗设计我们SARS-CoV-2的进化和地方的特性gydF4y2Ba17gydF4y2Ba。此外,疫苗适应匹配病毒序列的进化可能有助于缓解不同民族之间的增加发病率和死亡率在夏威夷ʻ我gydF4y2Ba5gydF4y2Ba,gydF4y2Ba6gydF4y2Ba。我们利用在夏威夷ʻSARS-CoV-2孤立我,全基因组序列(WGS)存入基因库和GISAID,结合VOC和VOI验证算法,一个原型α测试rationally-designing逻辑下一代疫苗。随着SARS-CoV-2的发展,所以必须SARS-CoV-2监测和疫苗的设计。gydF4y2Ba

结果gydF4y2Ba

病毒隔离、生长动力学和基因组等价gydF4y2Ba

病毒从一个孤立的口咽(OPS)收集五天症状出现后的个体与PCR证实SARS-CoV-2感染和传播州立E6细胞。股票SARS-CoV-2,隔离USA-HI498 2020年生产三个段落州立E6细胞。最小的CPE观察到12 h,温和的CPE在24 h,和非凡的CPE 48 h(图。gydF4y2Ba1模拟gydF4y2Ba)。斑块分析被用来量化SARS-CoV-2隔离。股市的病毒效价为1.28×10gydF4y2Ba7gydF4y2Ba空斑形成单位/毫升SARS-CoV-2隔离USA-HI498和3.88×10gydF4y2Ba7gydF4y2Ba空斑形成单位/毫升SARS-CoV-2 USA-WA1/2020。病毒拷贝数分析使用N1、N2和RdRp引物以及显微观察显示SARS-CoV-2之间不存在差异,隔离USA-HI498 2020和SARS-CoV-2 USA-WA1/2020(无花果。gydF4y2Ba1 e mgydF4y2Ba)。SARS-CoV-2、隔离USA-HI498 2020存入贝资源猫# nr - 56130和相应的全基因组序列的基因库(加入MZ664037数量)。gydF4y2Ba

图1:细胞病变效应和增长SARS-CoV-2动力学,隔离USA-HI498 2020。gydF4y2Ba
图1gydF4y2Ba

该图显示了延时VeroE6细胞感染的细胞图像SARS-CoV-2隔离USA-HI498 2020在不同的时间点,证明病毒引起的细胞病变效应(CPE)在感染复数(MOI) 1。gydF4y2Ba一个gydF4y2Ba0 h,gydF4y2BabgydF4y2Ba12 h,gydF4y2BacgydF4y2Ba24小时,gydF4y2BadgydF4y2Ba48 h。酒吧等于200µm规模。gydF4y2BaegydF4y2Ba基因(组)相当于SARS-CoV-2、隔离USA-WA-1/2020 N1引物。gydF4y2BafgydF4y2Ba组SARS-CoV-2,隔离USA-WA-1/2020 N2引物。gydF4y2BaggydF4y2Ba组SARS-CoV-2,隔离USA-WA-1/2020 RdRp引物。gydF4y2BahgydF4y2Ba组SARS-CoV-2,隔离USA-HI498/2020 N1引物。gydF4y2Ba我gydF4y2Ba组SARS-CoV-2,隔离USA-HI498/2020 N2引物。gydF4y2BajgydF4y2Ba组SARS-CoV-2,隔离USA-HI498/2020 RdRp引物。gydF4y2BakgydF4y2Ba增长动力学SARS-CoV-2隔离USA-HI498/2020和USA-WA-1/2020感染复数(MOI)使用N1 1和0.1 / 48 h组(e、h)。gydF4y2BalgydF4y2Ba增长动力学SARS-CoV-2隔离USA-HI498/2020(黄色和绿色)和USA-WA-1/2020(蓝色和红色)莫伊1和0.1 / 48 h使用N2组(gydF4y2BafgydF4y2Ba和gydF4y2Ba我gydF4y2Ba)。gydF4y2Ba米gydF4y2Ba增长动力学SARS-CoV-2隔离USA-HI498/2020和USA-WA-1/2020莫伊1和0.1 /使用RdRp 48 h组(gydF4y2BaggydF4y2Ba和gydF4y2BajgydF4y2Ba)。gydF4y2Ba

全基因组测序和信息gydF4y2Ba

RNA提取使用rt - pcr证实gydF4y2Ba16gydF4y2Ba。有702978年和792952年为SARS-CoV-2读取,分别隔离USA-HI498 2020和HI708(补充表gydF4y2Ba1gydF4y2Ba)。FastQC确认的质量未装饰的和修剪FastQC文件。没有变化的核苷酸序列VTM和股票之间的病毒。整个基因组序列的原始VTM (OK021552 OK189251)和股票病毒(MZ664037 MZ664038)存入基因库。gydF4y2Ba

夏威夷ʻ我SARS-Cov-2序列和血统的搜索gydF4y2Ba

从基因库,317年的整个基因组SARS-CoV-2序列得到7月28日,2021年。此外,额外获得GISAID 2942序列。夏威夷ʻ我有52个独特的血统在3259年代表序列(a . 1、A.2.2出具,AY.1, AY.2, B,责任,B.1.1, B.1.1.207, B.1.1.222, B.1.1.304, B.1.1.316, B.1.1.380, B.1.1.416, B.1.1.519, B.1.1.7, B.1.108, B.1.139, B.1.160, B.1.2, B.1.234, B.1.241, B.1.243, B.1.265, B.1.298, B.1.340, B.1.351, B.1.357, B.1.36.8, B.1.369, B.1.37, B.1.400, B.1.413, B.1.427, B.1.429, B.1.517, B.1.526, B.1.561, B.1.568, B.1.575, B.1.588, B.1.595, B.1.596, B.1.601, B.1.609, B.1.617.2, B.1.623, B.6,第1页,P.1.1,第19,R.1)。截至2021年4月12日,GISAID报告了8809全球B.1.243血统的序列。B.1.243变体是由717年的1002(72%)序列从夏威夷ʻ我策划。这患病率下降到23%,2021年7月28日。在世界范围内,GISAID报告8809 B.1.243谱系序列。gydF4y2Ba

定量SARS-Cov-2变异和氨基酸替换/删除表位映射相比飙升的蛋白质gydF4y2Ba

13个基因序列之间的输出S基因排列(12武汉变异和一个参考序列)确定49单核苷酸多态性(SNP)。皮尔森对logarithmically-transformed患病率的相关计算的12 SARS-CoV-2变体在这项研究为了最高到最低gydF4y2BargydF4y2Ba值,分别为ο变体,如补充表中列出gydF4y2Ba2gydF4y2Ba,无花果。gydF4y2Ba2gydF4y2Ba,gydF4y2Ba3gydF4y2Ba和补充图。gydF4y2Ba2gydF4y2Ba。gydF4y2Ba

图2:皮尔逊logarithmically-transformed患病率的相关比率SARS-CoV-2变异的问题,感兴趣的变体,和其他血统。gydF4y2Ba
图2gydF4y2Ba

这个图展示了SARS-CoV-2变异的定量问题,感兴趣的变体,和其他血统。变体的出现和消失/血统SARS-CoV-2评估由皮尔森相关的对数转换流行的数据(gydF4y2BangydF4y2Ba= 1479378生物独立样本)。变量显示在减少gydF4y2BargydF4y2Ba价值。皮尔森相关的对数转换患病率和时间作为SARS-CoV-2血统的区间值gydF4y2Ba一个gydF4y2Ba第1页,gydF4y2BabgydF4y2BaB.1.617.2,gydF4y2BacgydF4y2BaB.1.617.1,gydF4y2BadgydF4y2BaB.1.351,gydF4y2BaegydF4y2BaB.1.1.7,gydF4y2BafgydF4y2BaB.1.429,gydF4y2BaggydF4y2BaB.1.427,gydF4y2BahgydF4y2BaB.1.525,gydF4y2Ba我gydF4y2Ba使他们,gydF4y2BajgydF4y2BaB.1.243,gydF4y2BakgydF4y2BaB.1.1.298,gydF4y2BalgydF4y2BaB.1.1。图生成使用开源RStudio版本1.3.1093 (R版本4.0.3)和ggplot2包在麻省理工学院+许可证(gydF4y2Bahttps://cran.r-project.org/web/packages/ggplot2/index.htmlgydF4y2Ba)。图是编译和使用Biorender.com创建的最终数字。gydF4y2Ba

图3:皮尔逊logarithmically-transformed患病率的相关比率的οSARS-CoV-2变体的担忧。gydF4y2Ba
图3gydF4y2Ba

这个图展示了买卖的定量SARS-CoV-2变体的担忧。显示了出现的集体变体(B.1.1.529 + BA。*)。日常中演示了分区分区(gydF4y2Ba一个gydF4y2Ba)(gydF4y2BangydF4y2Ba= 1077671生物独立样本),每周分区(gydF4y2BabgydF4y2Ba)(gydF4y2BangydF4y2Ba= 1375929生物独立样本),双分区(gydF4y2BacgydF4y2Ba)(gydF4y2BangydF4y2Ba= 1582268生物独立样本),每月原型分区(gydF4y2BadgydF4y2Ba)(gydF4y2BangydF4y2Ba= 2154954生物独立样本)。每个血统和分区显示日期VOC将分类“感兴趣的”(橙色/橙色虚线)和“关注”(红/红虚线)定义的算法。此外,截止日期提交说明何时会发生分类。*gydF4y2BapgydF4y2Ba< 0.05,* *gydF4y2BapgydF4y2Ba< 0.005,* * *gydF4y2BapgydF4y2Ba< 0.0005,* * * *gydF4y2BapgydF4y2Ba< 0.00005。使用开源的图形生成R和ggplot2包在麻省理工学院+许可证(gydF4y2Bahttps://cran.r-project.org/web/packages/ggplot2/index.htmlgydF4y2Ba)。图是编译和使用Biorender.com生成的最终数字。gydF4y2Ba

进一步,49 S基因的SNP, 44导致非同义AAS和删除的蛋白质,和5中同义的无花果。gydF4y2Ba4 a、b c.i-xiigydF4y2Ba和补充表gydF4y2Ba2gydF4y2Ba和gydF4y2Ba3gydF4y2Ba。皮尔森对logarithmically-transformed患病率的相关计算确定SARS-CoV-2 AAS和删除(补充表gydF4y2Ba2gydF4y2Ba,gydF4y2Ba3gydF4y2Ba,无花果。gydF4y2Ba5gydF4y2Ba和补充图。gydF4y2Ba1gydF4y2Ba)。gydF4y2Ba

图4:SARS-CoV-2峰值蛋白质域和B和T细胞抗原表位、变异氨基酸替换,和疫苗氨基酸替换。gydF4y2Ba
图4gydF4y2Ba

这个图展示了SARS-CoV-2变异的进化描绘的位置变量替换和删除的域和抗原表位。gydF4y2Ba一个gydF4y2BaSARS-CoV-2卡通渲染和1273氨基酸长突起蛋白覆盖到彩色晶体结构由电子显微镜(PBD ID: 6 vxx-pdb)。个体蛋白质域不同的颜色加以区分:n端结构域(元)(浅紫色)(残留14 - 305)受体结合域(RBD)(水鸭绿色)(319 - 541)有农药残留,furin (F)(682 - 685)有农药残留,融合蛋白(FP)(绿色)(788 - 806)有农药残留,七个重复1 (HR1上)(橙色)(912 - 984)有农药残留,七个重复2(的HR2)(橙色)(1163 - 1213)有农药残留,跨膜锚(TM)(浅粉)(1213 - 1237),和细胞内的尾巴域(IT)(深粉红色)(1237 - 1273)。gydF4y2BabgydF4y2Ba二维布局的蛋白质和域的S1 / S2 furin裂解位点(基本/ R)(682 - 685)(黑色)。gydF4y2BacgydF4y2Ba在硅片B和T细胞表位预测393位点暴露在硅片B和T细胞抗原表位映射i-xiii单独作为一个黄色的盒子。氨基酸替换出现在相应的变体所示粉红色盒子相比NC_045512参考序列。(我)B.1.243夏威夷;(2)B.1.1.7英国;(3)B.1.351南非;(四)B.1.1尼日利亚;(v) B.1.1.298丹麦;(vi) B.1.427 B.1.429加州;(七)第1页巴西;(八)第19巴西; (ix) B.1.617.1 India; (x) B.1.617.2 India; (xi) B.1.525 United Kingdom/Nigeria; (xii) B.1.1.529+BA.* South Africa; (xiii) Pfizer and Moderna mRNA sequences with artificially added substitutions K986P and V987P; (xiii) Novavax and Janssen mRNA sequences with artificially added substitutions R682S/Q, R683Q, R685G/Q, K986P, and V987P. Adapted from “An In-depth Look into the Structure of the SARS-CoV-2 Spike Glycoprotein”, by BioRender.com (2021). Retrieved fromhttps://app.biorender.com/biorender-templatesgydF4y2Ba。gydF4y2Ba

图5:皮尔逊logarithmically-transformed患病率的相关比率最紧急SARS-CoV-2突变的关心和兴趣选择通过算法。gydF4y2Ba
图5gydF4y2Ba

这个图显示的图形表示logarithmically-transformed流行数据用于计算皮尔逊相关(gydF4y2BangydF4y2Ba= 1483155生物独立样本)每个二十的大多数出现(关心的)和紧急(感兴趣的)峰值蛋白质替换和删除。的替换和删除关注以下的顺序递减gydF4y2BargydF4y2Ba价值,每个人都有一个独特的字母标识符(gydF4y2Ba一个gydF4y2Ba)P681H, (gydF4y2BabgydF4y2Ba)ΔV70, (gydF4y2BacgydF4y2Ba)ΔH69, (gydF4y2BadgydF4y2Ba)N501Y, (gydF4y2BaegydF4y2Ba)S982A, (gydF4y2BafgydF4y2Ba)D1118H, (gydF4y2BaggydF4y2Ba)T716, (gydF4y2BahgydF4y2Ba)A570D, (gydF4y2Ba我gydF4y2Ba)ΔY144, (gydF4y2BajgydF4y2Ba)D614G。算法使用月度发病率数据从这些十突起蛋白替换和删除,他们最有关的峰值变化。感兴趣的替换和删除以下订单的减少gydF4y2BargydF4y2Ba价值和每一个独特的替换或删除用英文字母,(gydF4y2BakgydF4y2Ba)E484K, (gydF4y2BalgydF4y2Ba)T478K, (gydF4y2Ba米gydF4y2Ba)P26S, (gydF4y2BangydF4y2Ba)L452R, (gydF4y2BaogydF4y2Ba)A701V, (gydF4y2BapgydF4y2Ba)W152C, (gydF4y2Ba问gydF4y2Ba)T95I, (gydF4y2BargydF4y2Ba)H655Y, (gydF4y2Ba年代gydF4y2Ba)S13I, (gydF4y2BatgydF4y2Ba)D138Y。使用开源的图形生成R和ggplot2包在麻省理工学院+许可证(gydF4y2Bahttps://cran.r-project.org/web/packages/ggplot2/index.htmlgydF4y2Ba)。图是编译和使用Biorender.com创建的最终数字。gydF4y2Ba

返回的PubMed搜索表位预测42出版物。总的来说,393年的计算机预测B和T细胞抗原表位对应的蛋白质被映射这些出版物(无花果。gydF4y2Ba4 bgydF4y2Ba)。其中,108抗原表位n端结构域(元)102抗原表位受体结合域(RBD), 7 S1 / S2抗原表位涉及furin裂解位点,10个抗原表位融合肽,20涉及七个重复1、12涉及七个重复2,涉及12个跨膜区域,涉及8细胞内尾域。这些领域以外的其余112抗原表位下跌。进一步说,239年和151年的抗原表位S1和S2,分别与至少一个预测蛋白质抗原决定基覆盖97%的峰值。gydF4y2Ba

变异的比较gydF4y2Ba

为了演示算法的实现,在补充表gydF4y2Ba3gydF4y2Ba,我们展示了独特的核苷酸变异和产生的原子吸收光谱法和删除的每个十二SARS-CoV-2变体,与参考序列。BNT162b2(辉瑞)和信使rna - 1273(现代化)疫苗包含两个原子吸收光谱法(K986P和V987P)(图gydF4y2Ba4 c.xiigydF4y2Ba)gydF4y2Ba18gydF4y2Ba。诺瓦瓦克斯公司和詹森疫苗也包含两个原子吸收光谱法,K986P V987P。此外,额外的原子吸收光谱法在furin裂解位点包括R862Q, R683Q,和R685Q(该公司),和R682S R685G(詹森(图)。gydF4y2Ba4 c.xiiigydF4y2Ba)gydF4y2Ba18gydF4y2Ba。gydF4y2Ba

B.1.243发展史和起源跟踪gydF4y2Ba

我SARS-CoV-2序列的夏威夷ʻ基因库和GISAID结合所有全球B.1.243血统产生一个初始MAFFT 8820序列对齐。此外,4273序列模棱两可和1596个重复序列被移除。构建系统发育树的最终对准2953独特而明确的B.1.243序列。使用这种方法gydF4y2Ba19gydF4y2Ba,我们能够定义SARS-CoV-2的起源,隔离USA-HI498 2020和HI708(无花果。gydF4y2Ba6gydF4y2Ba)。gydF4y2Ba

图6:全球所有B.1.243谱系序列的系统发育树。gydF4y2Ba
图6gydF4y2Ba

这个图显示了系统发育树用于确定的起源B.1.243序列用于这项研究。我们使用8822 SARS-CoV-2 B.1.243全基因组序列公布全球共享禽流感数据项目(GISAID)与基因库截至4月12日,2021年来定义原点。从8822年4273年之间模棱两可的核苷酸5’和3’非翻译区确定使用多个对齐使用快速傅里叶变换(MAFFT)。此外,1588是重复序列和8个重复识别由sRNA工具箱。因此,最后的树是构造使用FastTree Geneious ' 2021.1.1 (gydF4y2Bahttp://www.geneious.comgydF4y2Ba)从2953年独特而明确的SARS-CoV-2全基因组序列。紫色HI498(文本)的起源被定义为新墨西哥州(蓝色文本)和hi - 708(紫色文本)起源被定义为加州(蓝色文本)。地图用R和usmaps包和GNU通用公共许可证(GPL), v3 (gydF4y2Bahttps://cran.r-project.org/package=usmapgydF4y2Ba)。创建BioRender.com。gydF4y2Ba

讨论gydF4y2Ba

在这个报告中,我们为一个自适应奠定基础和理性监控SARS-CoV-2进化算法和量化中变异的疫苗的设计。此外,我们描述了隔离,遗传特性,系统发育分析,免疫遗传的突起蛋白的抗原表位基于SARS-CoV-2从夏威夷血统B.1.243ʻ我。我们使用B.1.243建立和验证算法,以及分析VOC和VOI的背景下新兴峰值蛋白质氨基酸变化监测和未来的疫苗的设计。gydF4y2Ba

夏威夷ʻ我也无法免于这种流行病,和多样的少数民族人口不成比例的感染SARS-CoV-2相比其他人种和种族gydF4y2Ba5gydF4y2Ba。B.1.243血统的分离和鉴定后SARS-CoV-2隔离,隔离USA-HI498 2020病毒株HI708,我们发现通过管理和分析发表序列B.1.243家族曾经是统治血统在夏威夷ʻ我,导致超过40%的情况下。B.1.243血统,一旦主导总体患病率在夏威夷ʻ我介绍从华盛顿,宾夕法尼亚州,加州和新墨西哥州,多数序列引起的横向转移在夏威夷ʻ我。SARS-CoV-2,隔离USA-HI498 2020被介绍给夏威夷ʻ我来自新墨西哥和hi - 708 SARS-CoV-2应变起源于加州。这份报告是写,类似于美国大陆SARS-CoV-2三角洲变体在夏威夷ʻ我迅速蔓延gydF4y2Ba20.gydF4y2Ba。gydF4y2Ba

在提交的时候,疾控中心确认四SARS-CoV-2变异VOC: B.1.1.7(α),B.1.351(β),B.1.617.2(δ)和第1页(γ)gydF4y2Ba1gydF4y2Ba。我们的定量数据分析支持这些VOC的指数出现,最紧急的是第1页,其次是B.1.617.2, B.1.351 B.1.1.7,皮尔森的相关性gydF4y2BargydF4y2Ba值的0.97、0.96、0.94和0.92,分别。这份报告中描述的定量分析给出了一个数值,每个VOC出现,预测的可能性血统将成为流行和蔓延到整个人口。这个值然后表明VOC基因组可能具有选择性的进化改变。之前,使用此定量分析,我们证明了P681H替换,而2020年12月全球患病率为2%,然后出现在2021年4月的79%gydF4y2Ba16gydF4y2Ba。同样,使用这种定量分析2021年4月,我们预测三角洲变体在夏威夷的传播和全球截至2021年6月gydF4y2Ba19gydF4y2Ba。gydF4y2Ba

在这个报告中,我们证明了特征出现和使用B.1.1.7 VOC挥发性有机化合物的选择性进化作为一个例子,皮尔森的相关性为0.92。B.1.1.7 VOC,最普遍的VOC全球2021年4月,后蔓延全球新兴在英国在2020年12月gydF4y2Ba21gydF4y2Ba。如上所述,B.1.1.7 VOC代表了逃避被VOC不断演变的疫苗血清和变得更强的传染性gydF4y2Ba22gydF4y2Ba,gydF4y2Ba23gydF4y2Ba。同样,δ变体,预测指数与一个新兴的定量分析gydF4y2Bar -gydF4y2Ba值为0.96的2021年4月患病率1%,已经成为世界范围内最普遍的2021年6月,代表全球64%的序列。gydF4y2Ba

病毒的传播性、流行和逃税的单克隆抗体和疫苗有关gydF4y2Ba24gydF4y2Ba。因此,挥发性有机化合物的定量导致识别和定量各自的突变。两两之间的热图变异和突变(补充表gydF4y2Ba2gydF4y2Ba)表明,SARS-CoV-2基因组可能自发突变或恢复野生型,证明在其他统计分析监测这一流行病gydF4y2Ba25gydF4y2Ba。gydF4y2Ba

我们能够建立在这个报告中描述的算法基于十大出现AAS和删除。我们评估九AAS和删除中观察到的变异在这项研究中,5月12日,2021年gydF4y2BargydF4y2Ba2021年4月0.9 >,> 70%患病率。包括这些AAS和删除,P681H、ΔV70ΔH69, N501Y, S982A, D1118H, T716I A570D,ΔY144。一个新兴的数据显示,平均时间替换(gydF4y2BargydF4y2Ba> 0.9)从每月的患病率比例> 30% > 50%的发病率是2.25个月。这些研究结果推断,辉瑞的时间表确定新出现的变化,制造成一个新版本的BNT162b2疫苗将是60 - 110天。这个时间段是大致相当于算法的预测价值gydF4y2Ba26gydF4y2Ba。此外,第十AAS用于算法的发展D614G允许我们上月的辨别流行,这是一个重要的参数,一旦基因组中建立一个新兴的突变gydF4y2BargydF4y2Ba值将大大减少。九个替换和删除也从>显示平均4.75个月每月患病率2%每月的流行率> 50%。因此,gydF4y2BargydF4y2Ba> 0.9和流行率> 2%就足以建立一个突变是感兴趣的,而30%患病率升级一个突变的地位问题。的评价十总蛋白质的变化,算法得出结论:一个gydF4y2BargydF4y2Ba> > 0.9和30%患病率是一个最佳的时间百分比分类有关的替换,并考虑替换包含到疫苗主要结构60天生产时间。gydF4y2Ba

这些突变的兴趣和关心也可以用来促进使用感染性克隆和重点研究gydF4y2Ba27gydF4y2Ba,假gydF4y2Ba28gydF4y2Ba和深度突变扫描gydF4y2Ba11gydF4y2Ba,gydF4y2Ba12gydF4y2Ba确定功能特征和临床治疗的后果。疫苗研发的重视识别哪些突起蛋白在所有测序的基因组变化是全球最普遍。每个替换或删除或组合,有可能作为抗原决定基。事实上,一些替换的担忧(N501Y)感兴趣的(K417N和E484K)显示在此也参与单克隆抗体抗原表位在深RBD的突变扫描gydF4y2Ba11gydF4y2Ba。升压疫苗使用此算法可以因此准备接种疫苗的任何变体他们最有可能遇到通过识别,包括新兴市场和代表全世界大多数SARS-CoV-2氨基酸的变化。深突变扫描,结合跟踪gydF4y2Ba19gydF4y2Ba,gydF4y2Ba29日gydF4y2Ba这个算法,可以促进公共卫生政策建议的使用或停止马伯逃避突变时蔓延,而不是治疗开始后失败gydF4y2Ba10gydF4y2Ba。在未来版本的这个算法,数据应该每24小时更新一次,评估经常对疫苗设计的建议。这是证明的改善和更严格的预测价值ο出现更频繁的分区。gydF4y2Ba

证明我们的算法应用到现在出现了三角洲变体,我们画一个比较算法和团体的决定分类三角洲VOC变体。我们的算法会分类三角洲作为VOC适合调整疫苗7月1日,2021 (gydF4y2BargydF4y2Ba= 0.95,6月流行07/01/2021 = 66% (gydF4y2BangydF4y2Ba= 1780846生物独立样本),日期只有17天后比团体。调整算法来重新分配两周一次的而不是每月(用于分类)就会给三角洲VOI状态05/01/2021和VOC状态当日CDC(2021年6月15日)(02/15/2021 - 06/14/2021;gydF4y2BargydF4y2Ba= 0.997,6月流行06/15/2021 = 76% (gydF4y2BangydF4y2Ba= 1067791生物独立样本)。我们表明,该算法是一个标准化的方法与当前的实践专家分类,进一步支持这些专家提供统计和公开可见。考虑到两个月的疫苗生产时间,潜在的助推器疫苗可用的三角洲变异可能是9月1日,2021年。三角洲变体是全球普遍的95%在2021年8月(259299 273881序列08/31/2021在2021年8月)。gydF4y2Ba

在几乎整个突起蛋白抗原表位被发现。在硅编译的B细胞和T细胞抗原表位预测表明,53%(210/393)的抗原表位发生在被忽视的热带病,RBD。这是符合体内mRNA-LNP疫苗研究发现绝大多数的CD8 + T细胞反应目标抗原表位的氨基端部分的蛋白质gydF4y2Ba30.gydF4y2Ba。研究同样发现,CD4 + T细胞反应的目标gydF4y2BaS1gydF4y2Ba和gydF4y2BaS2gydF4y2Ba30.gydF4y2Ba。此外,大多数变异突变和中和抗体发生在目标gydF4y2BaS1gydF4y2Ba23gydF4y2Ba。S1是冠状病毒模型的融合gydF4y2Ba31日gydF4y2Ba,gydF4y2BaS2gydF4y2Ba负责融合的多样性gydF4y2BaS1gydF4y2BaSARS-CoV-2和抗原决定基的目标浓度gydF4y2BaS1gydF4y2Ba,表明SARS-CoV-2疫苗需要优化。gydF4y2Ba

这里,我们隔离并描述SARS-CoV-2在细胞培养和分析这些分离株的全基因组序列和序列存入GISAID为下一代疫苗开发的算法设计。我们应用原型法预测指数新兴突变这些隔离,然后发展定量分析算法来计算VOC, VOI,及其突变,允许进一步分类突变的关注和兴趣。因此,我们创建了一个简单而有效的疫苗设计系统,使用全球SARS-CoV-2测序数据以一种有意义的方式。序列是公开的,尚未有定义和逻辑的方式来利用新一代疫苗,单克隆抗体监测,增加公共政策措施防止传播新兴血统。该算法可以作为基准选择疫苗的主要结构。此外,我们以图形方式比较S基因的分离与SARS-CoV-2挥发性有机化合物的仪器,预测SARS-CoV-2 S基因突变的出现,蛋白质替换和删除,并评估他们在抗原表位的背景下。因此,我们创建一个基础为未来SARS-CoV-2监测和疫苗的努力我们在前进在这大流行(图。gydF4y2Ba7gydF4y2Ba)。这些流行的努力不能留在上下文响应和反应性的,但也需要先发制人和预测。先发制人的和预测的方法是可行的。gydF4y2Ba

图7:将该算法应用于疫苗的设计。gydF4y2Ba
图7gydF4y2Ba

模型显示如何算法会导致下一代疫苗的设计基于S基因。第一部分的模型识别所有SARS-CoV-2变体或基因突变和飙升的氨基酸替换和删除(表示为粉色线)基于全球序列数据库GISAID和基因库。当前的疫苗设计它转化为蛋白质被描述在前中心和右上方。模型的第二部分将在这个报告中描述的定量分析和算法的每个蛋白质变化识别部分。定量分析确定出现通过对数变换的患病率和皮尔逊相关性。算法然后标准适用于定量分析,前几个月发病率决定哪些变化可能在大多数SARS-CoV-2结合的新一代疫苗。第三部分确定模型的替换和删除指数新兴或出现(红线)和不(蓝线)。从第三部分,疫苗的信使rna序列可以包含新兴和出现突变,这样折叠蛋白质(右下角)将包含蛋白质变化(红点)全球最普遍的下一代疫苗生产和管理。因此,这些替换和删除将最合适的SARS-CoV-2突起蛋白的抗原表位疫苗接受者。改编自“深入调查SARS-CoV2飙升糖蛋白的结构”,由BioRender.com (2021)。 Created with BioRender.com.

这些发现有关联的未来跟踪SARS-CoV-2和SARS-CoV-2疫苗的设计。未来SARS-CoV-2疫苗是类似于流感病毒疫苗。表面上自然是流感疫苗每年根据往年监测数据变化gydF4y2Ba32gydF4y2Ba。如果建立在此描述的算法,研究人员将破译基因组进化SARS-CoV-2实时而不是变异进化后,出现了。gydF4y2Ba

方法gydF4y2Ba

患者样本gydF4y2Ba

人类临床样本分析这份报告是夏威夷大学的一部分ʻ我在Mānoa(嗯)批准了IRB - H051研究(# 2020 - 00367)(# NCT04360551)(病人识别(PID) 498年和708年PID)收集行动和鼻拭子(NS)在5和3天,症状出现后,分别。SARS-CoV-2积极状态确认使用定量reverse-transcriptase-polymerase连锁反应(存在)。样本储存在−80°C的嗯IBC批准研究(# 20-04-830-05)。所有SARS-CoV-2相关研究是在夏威夷大学进行的(嗯)认证机构每年生物安全委员会(IBC)和EHSO BSL-3设施约翰·a·伯恩斯医学院。gydF4y2Ba

病毒隔离gydF4y2Ba

维罗E6病毒隔离进行使用(写明ATCC crl - 1586)细胞,从PID 498行动收集在病毒传输介质(VTM)gydF4y2Ba16gydF4y2Ba。短暂、1 h后感染、细胞监测细胞病变效应(CPE)使用Cytosmart显微镜监视同一地点在瓶10倍变焦镜头。观察杰出的CPE 48 h后,上层清液通过三次维罗病毒E6细胞创建一个股票。简单地说,在第三段,细胞单层细胞上清液三次冻融−80 C。上层清液和细胞溶解产物离心机在5000 rpm 15分钟4 C和上层清液空斑实验整除。博士USA-WA1/2020,病毒是由穆克什·库马尔,乔治亚州立大学,从贝获得资源。PID 498行动和USA-WA1/2020病毒隔离和空斑实验量化使用双重叠加gydF4y2Ba33gydF4y2Ba。第一个覆盖层1 h-post-infection,最终覆盖层两个days-post-infection (dpi),三个dpi和斑块数。gydF4y2Ba

生长动力学gydF4y2Ba

2020年SARS-CoV-2后隔离,隔离USA-HI498生长动力学研究是由播种维罗E6细胞层的6孔板的细胞密度3×10gydF4y2Ba5gydF4y2Ba/一天前试验。测定,细胞被感染SARS-CoV-2 USA-WA1/2020 HI498 2020隔离。简单地说,当天化验,DMEM和10%的边后卫从井,细胞与血清DMEM洗两次,和接种感染复数(MOI) 0.1和1,稀释500年µL DMEM和2%的边后卫37°C和5%孵化有限公司gydF4y2Ba2gydF4y2Ba2 h。2 h吸附后,上层清液含有病毒移除,和单层膜洗两次与2%的边后卫,DMEM DMEM和进一步孵化2毫升2%的边后卫在37°C和5%的公司gydF4y2Ba2gydF4y2Ba直到上层清液收集在0、12、24和48 hgydF4y2Ba34gydF4y2Ba。gydF4y2Ba

RNA提取,存在和基因组等价gydF4y2Ba

确定基因组等价,RNA提取进行了使用QIAamp®病毒RNA迷你包(试剂盒,猫# 52906)后,制造商的指示,如前所述gydF4y2Ba16gydF4y2Ba。RNA提取进行了八个,十倍连续稀释(10gydF4y2Ba0gydF4y2Ba到10gydF4y2Ba−8gydF4y2Ba)gydF4y2Ba33gydF4y2Ba。引物和探针(N1、N2集和RdRp集)使用前面描述的gydF4y2Ba35gydF4y2Ba,gydF4y2Ba36gydF4y2Ba。一个TaqMan®多路中存在方法用于N1和N2底漆集。的QuantaBio qScript®XLT一步存在困难的组合(猫# 95132)是用来进行中存在的ABI StepOnePlus™实时PCR系统。SYBR绿色中存在方法用于RdRp底漆集。QuantaBio qScript®互补脱氧核糖核酸合成装备(猫# 95047)和QuantaBio正序连赢®qPCR ToughMix™,低火箭™(猫# 95114)是用来进行中存在的ABI StepOnePlus™实时PCR系统。gydF4y2Ba

标准曲线SARS-CoV-2隔离N1、N2, RdRp基因由策划循环阈值(Ct)值与相应的空斑形成单位(每毫升PFU)评估通过空斑实验SARS-CoV-2八10倍系列稀释的病毒隔离gydF4y2Ba33gydF4y2Ba。的标准曲线制作十fold-serial稀释的病毒被用来插入增长动力学实验的结果。所有的存在和基因组等效数据分析和可视化使用GraphPad棱镜9.2.0 9版本。gydF4y2Ba

全基因组测序gydF4y2Ba

WGS, RNA提取VTM和整除第三通道股票病毒,如上所述,与QIAamp®病毒RNA迷你包(试剂盒,猫# 52906)按照制造商的指示,如前所述gydF4y2Ba16gydF4y2Ba。简单地说,病毒RNA (vRNA)筛选了60µL洗脱缓冲。vRNA提取确认使用豆类RNA PCR工具包(猫# RR012A)和之前报道的引物gydF4y2Ba16gydF4y2Ba,gydF4y2Ba37gydF4y2Ba。反转录成RNA cDNA使用豆类RNA LA PCR工具包(猫# RR012A)根据制造商的协议但逆转录时间为90分钟。WGS由ASGPB核心,嗯。短暂、图书馆准备按照制造商的协议(Illumina公司文档# 1000000025416 v09)使用Illumina公司DNA准备工具包(猫# 20018704)和Nextera XT指标使用MiSeq测序试剂盒v3(600周期)(猫# ms - 102 - 3003)和一个Illumina公司MiSeq音序器。gydF4y2Ba

信息学gydF4y2Ba

WGS读取编译使用嗯法力高性能计算集群(HPC)。生fastq序列文件被FASTQC评估程序gydF4y2Ba38gydF4y2Ba质量控制指标。经过确认合格质量的整体阅读,低质量的序列与Trimmomatic过滤和削减从每个阅读gydF4y2Ba39gydF4y2Ba使用序列NexteraPE-PE paired-end适配器(ILLUMINACLIP: NexteraPE-PE: 2:30:10)和一个滑动4基地窗口评估质量phr得分超过30。修剪的结果与FASTQC质量确认。trimmed-paired-end读取被映射到使用Bowtie2 NC_045512参考基因组gydF4y2Ba40gydF4y2Ba和变异称为samtools mpileupgydF4y2Ba41gydF4y2Ba并从VCF FASTQ使用bcftools和vcfutilsgydF4y2Ba42gydF4y2Ba最后使用seqtk FASTA转换。进行比较和验证,fastq文件也计入Geneious ' 2021.1.1生产FASTA文件与冠状病毒装配工作流程gydF4y2Ba43gydF4y2Ba。合成共识序列来自每个夏威夷ʻ我隔离提交基因库(SARS-CoV-2,隔离USA-HI498 2020(股票病毒:MZ664037) (VTM: OK021552)和SARS-CoV-2,隔离USA-HI708 2020(股票病毒:MZ664038) (VTM: OK189251)。每个序列的血统决定的系统分配全球疫情(PANGO)家族命名法命名gydF4y2Ba44gydF4y2Ba,gydF4y2Ba45gydF4y2Ba,gydF4y2Ba46gydF4y2Ba。gydF4y2Ba

序列和血统搜索gydF4y2Ba

夏威夷ʻ我序列7月28日,2021年,从基因库和GISAID下载并寻找潜在的存在使用PANGO家族血统的担忧gydF4y2Ba19gydF4y2Ba,gydF4y2Ba44gydF4y2Ba,gydF4y2Ba45gydF4y2Ba,gydF4y2Ba46gydF4y2Ba。简而言之,所有序列都从基因库和GISAID下载,上传至穿山甲血统指定人(pangolin.cog-uk.io)和输出是评估使用Microsoft Excel患病率。gydF4y2Ba

变异的比较gydF4y2Ba

进行了比较评价两个夏威夷突变ʻ我B.1.243隔离到12其它VOC相比,VOI, 2021年5月12日和变异。从武汉NCBI SARS-CoV-2资源基因组参考序列是用来定义S基因(NC_045512)gydF4y2Ba47gydF4y2Ba。每个序列进行了两两对齐NC_045512定义S基因突变。血统(B.1.243)序列选择SARS-CoV-2 HI498 HI708。序列VOC, VOI和其他变体在这受到关注流行选择标准的最早完成日期明确的S基因序列集合。血统:使用B.1.1.7(英国VOC、EPI_ISL_601443)gydF4y2Ba21gydF4y2Ba,gydF4y2Ba48gydF4y2BaB.1.1(尼日利亚变体,EPI_ISL_729975)gydF4y2Ba49gydF4y2Ba,gydF4y2Ba50gydF4y2BaB.1.351(南非VOC、EPI_ISL_712081)gydF4y2Ba51gydF4y2BaB.1.1.298(丹麦变体,EPI_ISL_616802)gydF4y2Ba52gydF4y2Ba加州,B.1.427 (VOI EPI_ISL_1531901)gydF4y2Ba53gydF4y2Ba加州,B.1.429 (VOI EPI_ISL_942929)gydF4y2Ba54gydF4y2Ba第1页(巴西/日本VOC EPI_ISL_792680)gydF4y2Ba55gydF4y2Ba,gydF4y2Ba56gydF4y2Ba,第19(巴西VOI EPI_ISL_918536)gydF4y2Ba57gydF4y2BaB.1.617.1(印度VOI EPI_ISL_1372093)gydF4y2Ba58gydF4y2BaB.1.617.2(印度VOC, EPI_ISL_1663516)gydF4y2Ba59gydF4y2Ba和B.1.525(英国/尼日利亚VOI EPI_ISL_1739895)gydF4y2Ba60gydF4y2Ba。分离,血统的οvaraint (B.1.1.529 + BA。*、B.1.1.529 BA.1、BA.1.1 BA.2和BA.3)gydF4y2Ba1gydF4y2Ba评估了在全球范围内成为VOC或VOI分类。gydF4y2Ba

变异和氨基酸替换/删除表位映射相比飙升的蛋白质gydF4y2Ba

从上述变异比较部分,选中的S基因序列进行了两两对齐SnapGene NC_045512,和SNP。苏格兰民族党和Nextclade被输入到SnapGene序列特性gydF4y2Ba61年gydF4y2Ba确定氨基酸替换(AAS)。非同义替换被证实在GISAID使用元数据为每个加入号码。gydF4y2Ba

另外,以确定任何氨基酸在整个年代蛋白质都可以潜在的抗原决定基的一部分,下面的搜索参数中使用PubMed定位在网上研究预测抗原表位疫苗SARS-CoV-2:“((B细胞)或(B细胞)和((T细胞)或(T细胞)和(肽)和(疫苗抗原决定基)和((SARS-CoV-2)或(COVID-19))。2021年1月28日,“从这个搜索,三个最近的文章gydF4y2Ba62年gydF4y2Ba,gydF4y2Ba63年gydF4y2Ba,gydF4y2Ba64年gydF4y2Ba和三个最佳匹配的文章gydF4y2Ba65年gydF4y2Ba,gydF4y2Ba66年gydF4y2Ba,gydF4y2Ba67年gydF4y2Ba被选为进一步分析映射的蛋白质。所有预测抗原表位能够搜索和定义与SnapGene“发现蛋白质序列”功能都包括在内。条重叠在系统回顾只包含一次。gydF4y2Ba

统计和再现性gydF4y2Ba

PANGO服务器被用于识别和确认的血统上述13株变异比较部分中描述gydF4y2Ba45gydF4y2Ba,gydF4y2Ba46gydF4y2Ba。血统和确定了他们的集体AAS和单独搜索EpiCoV™在GISAID全球患病率从2020年3月- 2021年4月。每个家族(gydF4y2BangydF4y2Ba= 1479378)分别被过滤,如原子吸收光谱法(gydF4y2BangydF4y2Ba= 1483155)。参数选择序列,包括整整一个月,一天,一年的收藏。每个月的患病率为每个血统和原子吸收光谱法是对数转换为gydF4y2BaygydF4y2Ba变量的皮尔森相关(gydF4y2BangydF4y2Ba= 14)。的gydF4y2BaygydF4y2Ba变量是对评估gydF4y2BaxgydF4y2Ba作为一个区间值(变量,月gydF4y2BangydF4y2Ba= 14),确定一个指数增加,世界范围内出现gydF4y2Ba16gydF4y2Ba。皮尔森是计算使用RStudio版本1.3.1093 (R版本4.0.3)和绘制ggplot2包。皮尔森的相关性AAS和血统在相应的成对比较热图评估如果AAS出现独立的发生,或在串联,血统出现。gydF4y2Ba

算法gydF4y2Ba

从定量描述的算法所开发的十大出现氨基酸替换和删除。算法如下:gydF4y2Ba

对原子吸收光谱法、删除和血统,确定皮尔森系数的对数转换每月的患病率。gydF4y2Ba

如果皮尔森gydF4y2BargydF4y2Ba≥0.9:gydF4y2Ba

如果前一个月的流行率> 0.3:gydF4y2Ba

关注的新兴(“”)(包括在下一代疫苗设计)gydF4y2Ba

如果0.02≤≤0.3:前一个月的流行gydF4y2Ba

新兴(“感兴趣的”)(在深度突变扫描评估)gydF4y2Ba

其他:gydF4y2Ba

没有新兴gydF4y2Ba

其他:gydF4y2Ba

如果前一个月的发生率≥0.9:gydF4y2Ba

出现(“关注”)(包括在下一代疫苗设计)gydF4y2Ba

如果前一个月的患病率> 0.5:gydF4y2Ba

出现(“感兴趣的”)(在深度突变扫描评估)gydF4y2Ba

其他:gydF4y2Ba

不出现/新兴gydF4y2Ba

该算法将AAS和删除分为两类基于皮尔森的gydF4y2BargydF4y2Ba值,gydF4y2BargydF4y2Ba≥0.9和gydF4y2BargydF4y2Ba< 0.9。AAS和删除被称为有关,热阻应≥0.9和前一个月的全球流行的这些AAS和删除应该> 30%。此外,这些关于AAS和删除可以被认为是包含在下一代疫苗的设计。如果gydF4y2BargydF4y2Ba≥0.9和前一个月的患病率是2 - 30%,那么原子吸收或删除被归为有趣,在研究环境,需要评估。相同的算法也可以申请标准化分类SARS-CoV-2血统的兴趣和关注。gydF4y2Ba

如果gydF4y2BargydF4y2Ba< 0.9,然后重点是前一个月的患病率AAS和删除,作为建立突变后,不再需要评估出现。如果前一个月的流行率≥90%,然后建立了突变SARS-CoV-2基因组和应被视为下一代疫苗的一部分。如果前一个月的流行率> 50%,然后突变代表大多数,需要被认为是有趣的和评估在研究环境。再次,同样的算法也可以申请标准化分类SARS-CoV-2血统的利益或有关。gydF4y2Ba

B.1.243发展史和起源跟踪gydF4y2Ba

使用一个既定方法起源跟踪完成gydF4y2Ba19gydF4y2Ba。简而言之,所有B.1.243序列都从基因库和GISAID下载,对齐使用使用快速傅里叶变换(MAFFT) (gydF4y2Bahttps://mafft.cbrc.jp/alignment/server/add_fragments.html?frommanualnov6gydF4y2Ba修剪),3和5的区域,模棱两可的和重复的序列使用sRNA工具箱中移除(gydF4y2Bahttps://arn.ugr.es/srnatoolbox/helper/removedup/gydF4y2Ba),和一个近似最大似然系谱树根植与祖先的血统(EPI_ISL_406801)和B (MN908947)生成使用Geneious ' (gydF4y2Bahttp://www.geneious.comgydF4y2Ba)。序列从夏威夷是通过基因库和GISAID,连同SARS-CoV-2,隔离USA-HI498 2020 SARS-CoV-2隔离USA-HI708 2020(本研究),完成原点的决心。gydF4y2Ba

报告总结gydF4y2Ba

进一步研究信息设计是可用的gydF4y2Ba自然研究报告摘要gydF4y2Ba与这篇文章有关。gydF4y2Ba