ISME 커뮤니케이션 3권, 기사 번호: 85(2023) 이 기사 인용
2012 액세스
측정항목 세부정보
서로 다른 환경과 연결된 박테리아 게놈 변이를 이해하면 환경 전반에 걸쳐 미생물의 차별적 적응과 전달을 뒷받침하는 메커니즘에 대한 새로운 통찰력을 얻을 수 있습니다. 이러한 통찰력을 얻는 것은 공중 보건 감시에 도움이 되므로 병원체에 특히 중요합니다. 그러나 박테리아 게놈 변이에 대한 이해는 다양한 생태학적 맥락과 결합된 게놈 변이에 대한 조사가 부족하여 제한됩니다. 이러한 한계를 해결하기 위해 우리는 인간 병원체인 L. monocytogenes를 포함하는 식품 안전을 위한 중요한 박테리아 속인 Listeria에 중점을 두고 미국 전역의 자연 및 식품 관련 환경에서 수집한 대규모 게놈 데이터 세트를 분석했습니다. L. monocytogenes, L. seeligeri, L. innocua 및 L. welshimeri를 대표하는 토양에서 분리된 449개와 농업용수 및 농산물 가공 시설에서 분리된 390개에 대한 비교 유전체학 분석을 통해 게놈 프로파일이 각 환경에 따라 크게 다르다는 것을 발견했습니다. 종. 이는 환경 관련 서브클레이드와 세포 외피 생물 발생 및 탄수화물 수송 및 대사에 관여하는 플라스미드, 스트레스 섬 및 보조 유전자의 차별적 존재에 의해 뒷받침됩니다. Listeria 종의 핵심 게놈은 환경과도 밀접하게 연관되어 있으며 기계 학습을 사용하여 L. monocytogenes의 계통 수준에서 분리 소스를 정확하게 예측할 수 있습니다. 우리는 Listeria의 대규모 환경 관련 게놈 변이가 토양 특성, 기후, 토지 이용 및 동반 박테리아 종(주로 Actinobacteria 및 Proteobacteria를 대표함)에 의해 공동으로 주도되는 것으로 보인다는 것을 발견했습니다. 종합적으로, 우리의 데이터는 리스테리아 종의 개체군이 유전적으로 다양한 환경에 적응하여 자연 환경에서 식품 관련 환경으로의 전파를 제한할 수 있음을 시사합니다.
핵심 게놈(모든 개체에 존재하는 유전자)과 보조 게놈(모든 개체에 의해 공유되지 않는 유전자)을 모두 포함하는 박테리아 게놈은 유전자 획득 및 손실과 환경 선택 및 분산에 의해 매개되는 상동성 재조합으로 인해 종 내에서 매우 다재다능할 수 있습니다. 2,3,4]. 이러한 게놈 변이로 인해 박테리아 종(주로 비병원성 박테리아)이 탄소 및 무기 영양소의 공급원이 다른 환경 조건을 포함하여 다양한 생태학적 차원에서 살 수 있습니다[5]. 일부 인간 병원체(예: Bacillus anthracis, Clostridium spp., Listeria monocytogenes, Yersinia pestis, Burkholderia pseudomallei 및 Francisella tularensis)도 자연 환경에서 생존할 수 있지만[6] 다양한 환경에서의 게놈 변이에 대한 우리의 이해는 다음과 같은 이유로 제한됩니다. 인간 관련 환경에 비해 자연 환경에 대한 집중적인 조사가 부족합니다 [7,8,9]. 이는 병원체가 인간이 아닌 환경에 적응하는 근간을 이루는 생태학적 메커니즘에 대한 이해를 높이고, 자연 환경에서 인간 관련 환경으로 균주가 전파될 가능성을 추론하는 등 전염병에 대한 공중 보건 감시에 더 나은 정보를 제공할 수 있는 기회를 놓친 것입니다. .
식품 안전에 필수적인 그람 양성, 통성 혐기성, 비포자 형성 박테리아 속인 리스테리아는 공중 보건에 중요한 박테리아의 자연 환경과 인간 관련 환경 사이의 게놈 변이를 연구할 수 있는 기회 역할을 합니다. Listeria의 구성원은 자연환경뿐만 아니라 농업용 토양, 수질, 식품 가공 시설에도 널리 분포되어 있다[10,11,12]. 두 개의 리스테리아 종—L. monocytogenes 및 L. ivanovii는 통성 병원체로 간주됩니다. 다른 종은 비병원성이지만[13], 이러한 종(예: L. seeligeri, L. innocua 및 L. welshimeri)은 L. monocytogenes 오염을 촉진할 수 있는 조건의 증거로 간주되기 때문에 식품 산업에서 종종 테스트됩니다. [14, 15]. 따라서 리스테리아 종의 게놈 변이를 연구하면 자연 환경에서 식품 관련 환경 및 식품으로의 전염에 대한 통찰력을 얻을 수 있습니다. 이는 무살해 단계가 사용되는 비활성 병원체에 사용되는 신선 농산물과 같은 식품에 특히 중요합니다. 먹이사슬의 어느 지점에서나 도입된다.
0.8 and no premature stop codon was present, (ii) putative non-functional when 0.3 ≤ coverage <0.8 or premature stop codon was present, and iii) absent when no hits were observed in BLASTN or coverage was <0.3. A coverage of 0.3 and 0.8 was chosen as the cutoffs because (i) the multi-domain structure of proteins is most likely preserved when using a coverage of 0.8 [33], and (ii) at least 0.3 or less query coverage has been recommended to identify genes that span contigs and/or touch gaps [34]. When calculating the presence/prevalence of a given gene across genomes, only putative functional genes are included in the calculation./p>0.2 or <−0.2 with each Listeria taxon were defined as bacterial taxa that tend to have similar and dissimilar habitat preferences, respectively; these species were included in the co-occurrence network analysis. Networks of co-occurring bacterial species for each Listeria taxon were constructed using ggraph in R 3.6.0./p>70% are indicated by gray circles on the bifurcation nodes. The tree was rooted by the midpoint. Branches are color-coded by L. monocytogenes lineages. The tree is annotated by the presence/absence of virulence genes. The presence/absence gene matrices from the inner to the outer represent (i) genes located in the pathogenicity islands LIPI-1 (prfA, plcA, hly, mpl, actA, plcB), (ii) genes coding for internalins (inlABCEFGHJKIP), and (iii) genes located in the pathogenicity islands LIPI-3 (llsAGHXBYDP) and LIPI-4 (LM9005581_70009 to LM9005581_70014). A filled box represents the presence of a putative functional gene; an empty box represents a non-functional gene (i.e., being truncated or having premature stop codons); and a white box represents the absence of the gene. b Histograms showing the distribution of cgMLST allelic mismatches between isolates from soil and produce processing facilities (food plant) for L. monocytogenes (LM) lineage I (red), II (blue), and III (yellow). c ROC and PR curves for binary classifiers trained on cgMLST allelic profiles of LM lineage I, II, and III isolates. auROC: area under the curve of the receiver operating characteristic, auPR: area under the curve of precision-recall. Maximum likelihood phylogenetic tree of (d) L. innocua, (e) L. welshimeri, and (f) L. seeligeri based on the core SNPs of isolates of each species; isolates were obtained from soil, agricultural (ag.) water, and produce processing facilities (“food plant”). Trees were constructed based on 1000 bootstrap repetitions and were rooted by midpoint. Labels of isolates are color-coded by sources. Bootstrap values >70% are indicated by gray circles on the bifurcation nodes./p>2 (black dashed line) indicates that the COG category is significantly enriched (P < 0.05). The size of the circle is in proportion to the logarithm of the number of genes annotated as one COG category./p> 0.5; Fig. S8, Table S11). Many of these plasmid-correlated genes were annotated with functions involved in replication, such as resolvase and recombinase, and a few were involved in metal resistance (e.g., arsenic resistance operon repressor) (Table S11). Of note, a total of nine plasmid groups were detected, including rep13, rep25, rep26, rep32, rep33, rep35, rep7a, repUS25, and repUS43. To infer potential horizontal transfer of plasmids across environments and across species, we constructed a gene tree for each of the four plasmid groups that harbored by more than three genomes (rep25, rep26, repUS25, and repUS43). We found that the largest plasmid group, repUS25, was predominately present in soil isolates (81% out of 84 isolates) and exhibited two major clades with a mixture of isolates from both soil and food-associated environments and all four species, L. monocytogenes, L. seeligeri, L. welshimeri, and L. innocua (Fig. 3c). The plasmid group repUS43 was predominately present in isolates from food-associated environments (91% out of 11 isolates) and was exclusively detected in L. innocua (Fig. 3d). The plasmid group rep25 was also predominately present in isolates from food-associated environment (97% out of 29 isolates) and exhibit two major clades with a mixture of L. innocua and L. monocytogenes lineage II isolates (Fig. 3e). The plasmid group rep26 was exclusively found in isolates from food processing facilities and formed two major clades, one with L. welshimeri and L. inncoua isolates and the other with L. monocytogenes lineage II and L. welshimeri (Fig. 3f). These results suggest that plasmid groups are strongly associated with isolation sources and some plasmids (e.g., repUS25, rep25) may transfer across environments and species in Listeria./p>20% impervious cover. b Variable importance in predicting the ANI of isolates for LM, LM lineage II, L. seeligeri, and L. innocua based on % Inc MSE index in a random forest model. Abiotic variables on the y-axis are sorted in ascending order based on the median % Inc MSE value of 1000 repetitions. “spatial” indicates geographic distance. Minimum and maximum values are depicted by short vertical lines of whiskers; the box signifies the upper and lower quartiles, and the short line within the box signifies the median. Points above and below the whiskers indicate outliers. Boxes and whiskers are color-coded by ecological variable groups. c Network of co-occurring bacterial species and LM, L. seeligeri, L. innocua, and L. welshimeri. Each node stands for a bacterial species that had a Phi correlation coefficient (r) > 0.2 or < −0.2 with one Listeria species. Nodes representing Listeria species are in black (these data are based on culture data generated, not 16 S amplicon sequencing data), and other nodes representing co-occurring bacterial species are color-coded by phylum. An edge stands for the Phi correlation with an r > 0.2 or < −0.2 between the two nodes. The thickness of the edge is in proportion to the absolute value of the Phi correlation r. An orange edge represents a positive correlation, while a gray edge represents a negative correlation./p> 0.2; Table S13). A large proportion of the species positively correlated with L. monocytogenes and L. innocua (41% and 50%, respectively) was classified into the phylum Proteobacteria, including the families Hyphomicrobiaceae and Rickettsiaceae; 29% of the species positively correlated with L. seeligeri were classified into the phylum Planctomycetes, including the family Pirellulaceae; and 33% of the species positively correlated with L. welshimeri were classified into the phylum Actinobacteria, including the family Pseudonocardiaceae (Fig. 4c, Table S13). These positively correlated species may occupy similar habitats as these Listeria species./p> 0.2 and r < −0.2, respectively; Fig. S10, Table S13). These negatively correlated bacterial species may prefer different or distinct habitats than these Listeria taxa. In summary, we propose that certain Proteobacteria and Actinobacteria species are taxa of interest that might pose selective pressures on Listeria and contribute to its genome evolution in the soil environment./p>