인간 장내 미생물의 파지 디스플레이 기반 기능적 메타게놈 스크린을 통해 확인된 새로운 탄수화물 결합 도메인

블로그

홈페이지홈페이지 / 블로그 / 인간 장내 미생물의 파지 디스플레이 기반 기능적 메타게놈 스크린을 통해 확인된 새로운 탄수화물 결합 도메인

Oct 31, 2023

인간 장내 미생물의 파지 디스플레이 기반 기능적 메타게놈 스크린을 통해 확인된 새로운 탄수화물 결합 도메인

Communications Biology 6권, 기사 번호: 371(2023) 이 기사 인용 2698 액세스 1 인용 10 Altmetric Metrics 세부 정보 배양되지 않은 미생물은 아직 개발되지 않은 거대한 생물학적 자원을 나타냅니다.

커뮤니케이션 생물학 6권, 기사 번호: 371(2023) 이 기사 인용

2698 액세스

1 인용

10 알트메트릭

측정항목 세부정보

배양되지 않은 미생물은 새로운 유전자와 유전자 산물이라는 아직 개발되지 않은 거대한 생물학적 자원을 나타냅니다. 최근 게놈 및 메타게놈 시퀀싱 노력을 통해 기존 주석이 달린 유전자와 상동성인 수많은 유전자가 확인되었지만, 기존 주석이 달린 유전자와 중요한 서열 상동성을 찾지 못하는 주석이 없는 유전자의 거대한 풀이 아직 남아 있습니다. 기능적 메타유전체학은 새로운 유전자 산물을 식별하고 주석을 달 수 있는 방법을 제공합니다. 여기에서 우리는 기능적 메타유전체학을 사용하여 인간 장내 공생균의 부착, 장내 식민지화 및 복잡한 탄수화물 대사를 도울 수 있는 새로운 탄수화물 결합 도메인을 채굴합니다. 우리는 식이, 미생물 및 숙주 다당류/당접합체에 대한 건강한 인간 배설물 샘플로부터 메타게놈 파지 디스플레이 라이브러리의 구성 및 기능적 스크리닝을 보고합니다. 우리는 알려진 단백질 도메인에 대한 히트를 찾지 못하지만 탄수화물 결합 모듈과 같은 접힘을 포함할 것으로 예측되는 여러 단백질 서열을 식별합니다. 우리는 이러한 단백질 도메인 중 일부를 이종적으로 표현, 정제 및 생화학적으로 특성화하고 탄수화물 결합 기능을 보여줍니다. 우리의 연구는 이러한 글리칸의 라벨링, 시각화 및 분리에 유용할 수 있는 레반 결합 도메인과 4개의 복잡한 N-글리칸 결합 도메인을 포함하여 이전에 주석이 달지 않은 여러 탄수화물 결합 도메인을 보여줍니다.

지구에는 약 4~6 × 1030개 세포1, 1조 종 이상의2 미생물 군집이 있으며, 그 중 대다수는 표준 실험실 기술3로 배양되거나 연구되지 않았습니다. 미생물 군집은 새로운 효소와 생체분자를 채굴할 수 있는 잠재적 저장소를 나타냅니다4. 배양에 독립적인 방법을 적용한 시퀀싱 기반 및 기능적 메타유전체학은 새로운 생체분자의 발견을 위해 미생물 군집의 복잡성을 이해하고 활용하는 강력한 수단으로 사용되었습니다5. 메타게놈 DNA 라이브러리(코스미드, 포스미드6 또는 파지7과 같은 적합한 벡터 사용)의 구축 및 원하는 표현형에 대한 스크리닝을 포함하는 기능적 메타게놈학8을 통해 해당 유전자에 대한 사전 정보 없이 원하는 기능을 가진 유전자 산물을 코딩하는 유전자를 식별할 수 있습니다. 공개 데이터베이스의 서열 유사성을 기반으로 한 속성. 따라서 생명공학 응용을 위한 새로운 유전자/단백질을 제공하는 것과 함께 이 전략은 데이터베이스9에서 가상 단백질로 지정된 단백질의 기능적 할당에도 도움이 됩니다.

인간의 장은 전분, 헤미셀룰로오스, 식이성 식물 다당류뿐만 아니라 숙주 점액에 있는 뮤신의 내인성 글리칸11,12과 전분, 헤미셀룰로오스, 펙틴10. 97개의 글리코시드 가수분해효소만을 암호화하고 수크로스, 유당, 전분과 같은 탄수화물 영양소에 존재하는 글리코시드 결합의 작은 하위 집합을 17개만이 분해하는 인간 게놈과 달리, 인간 장내 미생물의 177개 참조 게놈으로 구축된 미니 미생물군집은 글리칸 대사를 담당하는 15,882개의 서로 다른 탄수화물 활성 효소(CAZyme) 유전자를 보유하고 있는 것으로 밝혀졌습니다14. 장내 복합 탄수화물 영양소의 대사는 인간 장내 미생물군을 구성하는 약 160종의 대략 1000조 개의 미생물로 구성된 CAZyme에 의해 수행된다는 것이 분명합니다15,16,17. CAZyme은 보조 비촉매 모듈 또는 탄수화물 결합 모듈(CBM)18과 함께 하나 이상의 촉매 도메인이 있는 모듈식 아키텍처를 갖는 경우가 많습니다. 효소 효율성19. CBM 외에도 박테리아 렉틴과 같은 다른 단백질도 장내 탄수화물 분자에 결합합니다20. 따라서 인간 장내 미생물 메타지놈은 혈액형22, 생물학적 특이성 친화성 정제23, 항종양 및 항바이러스 요법24을 위한 표적화 응용과 같은 다양한 응용 분야21에 활용될 수 있는 탄수화물 결합 단백질을 코딩하는 유전자의 거대한 보고입니다. 또한 숙주-공생 상호작용에 대한 우리의 이해를 더욱 발전시킬 수 있습니다.

144 bp, indicating enrichment. A high degree of selection was also evident from the high frequency of occurrence of PCR amplicons of the same size among randomly picked phage clones for a given selection condition and sometimes, even for phage clones from different elution conditions (e.g. Fig. 2a–f). We confirmed this by sequencing a few amplicons of the same size and verifying that they had the same sequence. Sequences of all recombinant phage clones identified are listed in Supplementary Data 1, Table S4./p>90% sequence identity amongst Ap-Ap2, Ap-Ap5 and St-Glc2, and amongst Am-Glc2, St-Glc1, and St-Glc5, with the clone Am-Glc2 (197 amino acids long, amylose binder eluted with glucose) mapping almost completely within St-Glc1 (370 amino acids long, starch binder eluted with glucose) (Supplementary Data 1, Tables S4 and S9)./p>50% of their molecular mass12 and a rich oligosaccharide repertoire of ~100 different O-glycan structures that are differentially present along the length of the gut, thereby creating unique niches and potential binding sites along the gut for the colonization of bacteria11,53, perhaps contributing to the varying microbiota composition in different regions of the gut54,55. The ability to bind to or utilize mucin provides a competitive edge in colonization of the gut56,57,58,59, and gut symbionts like Akkermansia muciniphila60, Bifidobacterium61, Bacteroides species58, and Lactobacillus fermentum62 indulge in mucosal glycan foraging, secreting glycoside hydrolases (GHs) for mucin glycan degradation59,63./p>

Based on our biochemical evidence of glycan binding (and the high sequence similarity between MU1 and MU3), we suggest that MG1, MN3 and MU1/MU3 domains be annotated as new CBMs in the CAZy database. Future studies can focus on how these glycan binding domains compare with existing LacNAc binding galectins21,64 and Siaα2-6 binding proteins such as the human influenza A and B virus lectin haemagglutinin65, Pseudomonas aeruginosa pili66, the surface protein antigen (PAc) of Streptococcus mutans67, mushroom Polyporus squamosus agglutinin (PSA)68, and the plant lectins, Sambucus nigra agglutinin (SNA), Sambucus canadensis agglutinin (SCA), Sambucus sieboldiana agglutinin (SSA), Wheat-germ agglutinin (WGA), Trichosanthes japonica (TJA-I), and ML-I of Viscum album69,70,71,72,6 Gal beta 1->4GlcNAc and HSO3(-)- > 6Gal beta 1->GlcNAc specific lectin in tuberous roots of Trichosanthes japonica. Biochemistry 31, 11647–11650 (1992)." href="/articles/s42003-023-04718-0#ref-CR73" id="ref-link-section-d78971106e2617"73./p>144 bp (which is the size of the amplicon expected for a non-recombinant phage amplified by the T7UP and T7DOWN primers) were considered to be recombinant. Enriched recombinant phages were further subjected to Sanger sequencing in-house (at IMTECH, using 16-capillary 3130xl Genetic Analyzer, Applied Biosystems). DNA sequences obtained were translated using ExPASy80 and visualized using FinchTV version 1.4.0. Sequences with more than 30 continuous amino acids (without any stop codon) were considered for further analysis. These metagenomic sequences were subjected to searches against both the protein sequence database, ‘UniRef100’81, and the profile databases, ‘pfamA-full’ and ‘pfamB’31, and ‘dbCAN2’33 using mmseqs282 at a very high sensitivity (-s 8.5). In addition, an all-against-all sequence search of the initial 33 query proteins was also performed. The general command run for these searches was ‘mmseqs easy-search input_protein_seqs search_database output.result_file tmp_directory -s 8.5 --format-mode 2‘. In the search against UniRef100, for each query protein sequence, the top five returned hits were retained and were then further searched for pfamA-full domains as above using mmseqs2. The fields ‘representativeMember_organismName‘ and ‘cluster_representative_name‘ (in Table S5) were obtained using uniprot API81. In the search result against pfamA-full, the field ‘pfam-family_description‘ (in Table S7) was obtained using https://github.com/AlbertoBoldrini/python-pfam (a python interface for pfamA). Three-dimensional structure predictions were performed for all amino acid sequences using a local server installed AlphaFold2, and structures were visualized using reverse rainbow coloring based on pLDDT scores in PyMOL (Schrodinger) (Supplementary Data 2)./p>6 Gal beta 1->4GlcNAc and HSO3(-)- > 6Gal beta 1->GlcNAc specific lectin in tuberous roots of Trichosanthes japonica. Biochemistry 31, 11647–11650 (1992)./p>