304 bir aan bir alxan lahayn tuubo duuban, tuubo zhemical zomponent, Biosynthetic Potential of the Global Marine Microbiome

Waad ku mahadsan tahay booqashada Nature.com.Waxaad isticmaalaysa nooc browser ah oo leh taageero CSS xaddidan.Waayo-aragnimada ugu fiican, waxaan kugula talineynaa inaad isticmaasho browser-ka la cusboonaysiiyay (ama aad damiso Habka Laqabsiga ee Internet Explorer).Intaa waxaa dheer, si loo hubiyo taageerada joogtada ah, waxaan ku tusineynaa goobta aan lahayn qaabab iyo JavaScript.
Sliders oo muujinaya saddex maqaal sawirkiiba.Isticmaal badhamada dambe iyo kuwa xiga si aad ugu dhex gudubto boggaga, ama badhamada kantaroolaha slide ee dhamaadka si aad ugu gudubto sawir kasta.

Sharaxaada alaabta oo faahfaahsan

304 tuubbo isku duuban oo bir ah oo aan bir lahayn
1. Tilmaamaha: Tuubbada gariiradda birta ah ee birta ah ee aan lahayn
2. Nooca: welded ama aan lahayn
3. Heerka: ASTM A269, ASTM A249
4. Tuubada gariiradda birta ah ee birta OD: 6mm ilaa 25.4MM
5. Dhererka: 600-3500MM ama sida looga baahan yahay macmiilka.
6. Dhumucda gidaarka: 0.2mm ilaa 2.0mm.

7. Dulqaad: OD: +/- 0.01mm;Dhumucda: +/- 0.01%.

8. Cabbirka godka gudaha ee gariiradda: 500MM-1500MM (waxaa lagu hagaajin karaa iyadoo loo eegayo shuruudaha macaamiisha)

9. Dhererka gariiradda: 200MM-400MM (waxaa lagu hagaajin karaa si waafaqsan shuruudaha macaamiisha)

10. Dusha sare: Nool ama la tirtiray
11. Qalabka: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, alloy 625, 825, 2205, 2507, iwm.
12. Baakadaha: bacaha tolmada leh ee kiis alwaax ah, palette alwaax ah, usheeda alwaax, ama sida looga baahan yahay macmiilka
13. Tijaabada: qaybta kiimikaad, xoogga dhalidda, xoogga xajinta, cabbirka adkaanta
14. Dammaanad qaad: Qaybta saddexaad (tusaale: SGS TV) kormeer, iwm.
15. Codsiga: Qurxinta, alaabta guriga, gaadiidka saliidda, kulaylka beddelka, samaynta biraha, samaynta waraaqaha, baabuurta, habaynta cuntada, caafimaadka, iwm.

Dhammaan Waxyaabaha Kiimikada ah iyo Hababka Jireed ee Birta Aan-la-aanta lahayn sida hoose:

Qalab ASTM A269 Halabuurka Kiimikada % ugu badnaan
C Mn P S Si Cr Ni Mo NB Nb Ti
TP304 0.08 2.00 0.045 0.030 1.00 18.0-20.0 8.0-11.0 ^ ^ ^ ^
TP304L 0.035 2.00 0.045 0.030 1.00 18.0-20.0 8.0-12.0 ^ ^ ^ ^
TP316 0.08 2.00 0.045 0.030 1.00 16.0-18.0 10.0-14.0 2.00-3.00 ^ ^ ^
TP316L 0.035 D 2.00 0.045 0.030 1.00 16.0-18.0 10.0-15.0 2.00-3.00 ^ ^ ^
TP321 0.08 2.00 0.045 0.030 1.00 17.0-19.0 9.0-12.0 ^ ^ ^ 5C -0.70
TP347 0.08 2.00 0.045 0.030 1.00 17.0-19.0 9.0-12.0 10C -1.10 ^

 

Qalab Daaweynta kulaylka Heerkulka F (C) Min. Adag
Brinell Rockwell
TP304 Xalka 1900 (1040) 192HBW/200HV 90HRB
TP304L Xalka 1900 (1040) 192HBW/200HV 90HRB
TP316 Xalka 1900 (1040) 192HBW/200HV 90HRB
TP316L Xalka 1900 (1040) 192HBW/200HV 90HRB
TP321 Xalka 1900 (1040) F 192HBW/200HV 90HRB
TP347 Xalka 1900 (1040) 192HBW/200HV 90HRB

 

OD, inji OD dulqaadka inch (mm) Dulqaadka WT % Dhererka dulqaadka inch (mm)
+ -
≤ 1/2 ± 0.005 ( 0.13 ) ± 15 1 / 8 ( 3.2 ) 0
> 1/2 ~ 1 1/2 ± 0.005 (0.13) ± 10 1 / 8 (3.2) 0
> 1 1 / 2 ~ < 3 1 / 2 ± 0.010 (0.25) ± 10 3 / 16 (4.8) 0
> 3 1 / 2 ~< 5 1 / 2 ± 0.015 (0.38) ± 10 3 / 16 (4.8) 0
> 5 1 / 2 ~< 8 ± 0.030 (0.76) ± 10 3 / 16 (4.8) 0
8~< 12 ± 0.040 (1.01) ± 10 3 / 16 (4.8) 0
12~< 14 ± 0.050 (1.26) ± 10 3 / 16 (4.8) 0

Bulshooyinka microbial-ka dabiiciga ahi waa kuwo kala duwanaansho ahaan iyo dheef-shiid kiimikaad.Marka laga soo tago kooxaha aan wax baran ee noolaha1, kala duwanaanshiyahani waxa kale oo uu leeyahay awood hodan ah oo lagu ogaanayo ensaymesyada deegaanka iyo bayoloji ahaan muhiim u ah iyo xeryahooda biochemical2,3.Si kastaba ha ahaatee, barashada kala duwanaanshiyahan si loo go'aamiyo waddooyinka genomic ee soo saara xayndaabyadan oo kale oo ku xidha martigelintooda ayaa weli ah caqabad.Awoodda biosynthetic ee noolaha ku jira badweynta furan ayaa weli ah mid aan la garanayn sababta oo ah xaddidaadyada falanqaynta dhammaan xogta xallinta genome ee qiyaasta caalamiga ah.Halkan, waxaan ku sahamiyaa kala duwanaanshaha iyo kala duwanaanshaha hidde-sideyaasha biosynthetic ee ku jira badweynta anagoo isku darsanayna ilaa 10,000 genomes microbial oo ka yimid unugyo dhaqan iyo unugyo keli ah oo leh in ka badan 25,000 genomes cusub oo dib loo dhisay oo laga soo qaaday 1,000 muunado biyaha badda ah.Dadaalladan ayaa lagu aqoonsaday ilaa 40,000 oo ah unugyo hidde-sideyaal cusub, kuwaas oo qaarkood laga helay kooxo phylogenetic ah oo aan hore looga shakin.Dadkaan, waxaan ku aqoonsanay nasab ay ku hodmeen rucubyada hiddo-wadaha biosynthetic ("Candidatus Eudormicrobiaceae") oo ka tirsan bakteeriyada phylum ee aan la beerin oo ay ku jiraan qaar ka mid ah noolayaasha ugu kala duwan ee biosynthetically kala duwan ee deegaankan.Kuwaas, waxaanu ku astaysanay dariiqooyinka phosphatase-peptide iyo pytonamide, anagoo aqoonsanayna dhacdooyinka qaab dhismeedka unugyada noole ee aan caadiga ahayn iyo enzymology, siday u kala horreeyaan.Gebogebadii, daraasaddan ayaa muujineysa sida xeeladaha ku saleysan microbiome ay awood u siin karaan sahaminta enzymes-ka aan hore loo sharraxin iyo cuntooyinka dabiiciga ah ee microbiota iyo deegaanka si liidata loo fahmay.
Microbes waxay wataan wareegyada biochemical ee caalamiga ah, waxay ilaaliyaan shabakadaha cuntada, waxayna ilaaliyaan caafimaadka dhirta iyo xayawaanka5.Faylogenetic, dheef-shiid kiimikaad iyo kala duwanaanshahooda shaqo waxay ka dhigan tahay awood hodan ah oo lagu heli karo taxa1 cusub, enzymes iyo xeryahooda biochemical, oo ay ku jiraan alaabada dabiiciga ah6.Bulshooyinka deegaanka, molecules-yadani waxay bixiyaan microorganisms leh noocyo kala duwan oo hawlo jireed iyo deegaaneed, laga bilaabo isgaarsiinta ilaa tartanka 2, 7.Marka lagu daro shaqooyinkooda asalka ah, alaabooyinkan dabiiciga ah iyo dariiqooyinkooda wax-soo-saarka hidde-sidaha ayaa bixiya tusaalayaal loogu talagalay codsiyada farsamada bayoolajiga iyo daaweynta2,3.Aqoonsiga waddooyinkan iyo isku xirka ayaa si weyn loo fududeeyay daraasadda microbes-dhaqameedka.Si kastaba ha ahaatee, daraasaadka taxonomic ee deegaanka dabiiciga ah ayaa muujiyay in tirada ugu badan ee noolaha aan la beerin8.Eexdan dhaqan ayaa xaddidaysa awooddayada aan uga faa'iidaysanayno kala duwanaanta shaqaynaysa ee ay dejiyeen microbes badan4,9.
Si looga gudbo xaddidaadyadan, horumarka tignoolajiyada tobankii sano ee la soo dhaafay ayaa u oggolaaday cilmi-baarayaasha in ay si toos ah (tusaale, iyada oo aan dhaqan hore lahayn) isku xigxiga jajabyada DNA-da microbial ee dhammaan bulshooyinka (metaagenomics) ama hal unug.Awoodda lagu soo ururiyo jajabyadan jajabyada genome-ga waaweyn iyo dib-u-dhiska genome-ga badan ee metagenomically la ururiyey (MAGs) ama hal genome oo la xoojiyay (SAGs), siday u kala horreeyaan, waxay furaysaa fursad muhiim ah daraasadaha taxocentric ee microbiome (ie, bulshooyinka microbial iyo microbiome).jidad cusub jeex.Wax hidde-side u gaar ah oo deegaan la siiyey) 10,11,12.Runtii, daraasadihii ugu dambeeyay waxay si weyn u balaadhiyeen matalaadda phylogenetic ee kala duwanaanshaha microbial on Earth1, 13 waxayna daaha ka qaadeen inta badan kala duwanaanshaha shaqeynta ee bulshooyinka microbial-ka gaarka ah ee aan hore loo daboolin ee taxanaha hiddo-wadaha genome (REFs)14.Awoodda lagu meeleeyo kala duwanaansho hawleed oo aan la ogaanin marka loo eego genome-ka martida loo yahay (ie, xallinta genome) ayaa muhiim u ah saadaalinta khadadka microbial-ka ee aan wali sifaysan ee loo malaynayo in ay calaamadeynayaan alaabada cusub ee dabiiciga ah15,16 ama raadinta xeryahooda oo kale dib ugu noqoshada soosaarkoodii asalka ahaa17.Tusaale ahaan, habka falanqaynta unugyada metagenomic iyo hal unug ee isku dhafan ayaa horseeday aqoonsiga Candidatus Entotheonella, koox ka mid ah bakteeriyada isbonji la xidhiidha dheef-shiid kiimikaad, sida soo-saareyaasha noocyo kala duwan oo suurtagal ah daroogada18.Si kastaba ha ahaatee, in kasta oo dhawaan la isku dayay in sahaminta genomic ee bulshooyinka microbial kala duwan,16,19 in ka badan saddex-meelood laba ee xogta metagenomic caalamiga ah ee badda ugu weyn ee ecosystems16,20 ayaa weli maqan.Sidaa darteed, guud ahaan, awoodda biosynthetic ee microbiome badeedka iyo kartideeda sida kaydka enzymatic cusub iyo alaabta dabiiciga ah ayaa weli ah mid aan si weyn loo baran.
Si loo sahamiyo awoodda biosynthetic ee microbiomes badeed heer caalami ah, waxaan marka hore isu geynay genome-ka microbial-ka badda ee la helay iyadoo la adeegsanayo hababka dhaqanka ku tiirsan iyo kuwa aan dhaqanka ahayn si loo abuuro xog-ururin ballaaran oo ku saabsan phylogenetics iyo shaqada hidda-wadaha.Baadhitaan lagu sameeyay xogtan ayaa daaha ka qaaday noocyo badan oo ah unugyada hiddo-wadaha biosynthetic (BGCs), kuwaas oo intooda badan ka tirsan qoysas aan wali la aqoonsanin.Intaa waxaa dheer, waxaan aqoonsannay qoys bakteeriyada aan la garanayn oo soo bandhigta kala duwanaanshaha ugu sarreeya ee BGC-yada ee badweynta furan ilaa maanta.Waxaan dooranay laba synthesis ribosomal iyo post-translationally modified peptide (RiPP) dariiqooyin si loo ansixiyo tijaabada iyadoo lagu salaynayo kala duwanaanshahooda hidde-sidaha ee wadooyinka hadda la yaqaan.Tilmaamaha shaqada ee waddooyinkan ayaa muujiyay tusaalooyin lama filaan ah oo enzymology ah iyo sidoo kale qaab-dhismeedyo aan caadi ahayn oo leh waxqabadyo xakameynaya borotiinka.
Markii hore, waxaanu ujeedadiisu ahayd inaanu abuurno ilo xogeed caalami ah oo loogu talagalay falanqaynta genome, anagoo diirada saarayna qaybaheeda bakteeriyada iyo qadiimiga ah.Si taas loo gaaro, waxaan uruurinay xogta metagenomic iyo 1038 muunado biyaha badda laga soo qaaday 215 goob muunad oo caalami ah loo qaybiyay (latitude kala duwan = 141.6 °) iyo dhowr lakab oo qoto dheer (laga bilaabo 1 ilaa 5600 m qoto dheer, oo daboolaya aagagga casiirka, mesopelagic iyo abyssal).Asalkii hore21,22,23 (Jaantus. 1a, xogta la dheereeyey, Jaantuska. 1a iyo Shaxda Dheeraadka ah 1).Marka laga soo tago bixinta juqraafiyeed ballaaran, muunadahan la soo xulay ayaa noo oggolaaday inaan is barbar dhigno qaybaha kala duwan ee microbiome-ka badda, oo ay ku jiraan fayras qani ah (<0.2 µm), prokaryotic-rich (0.2-3 µm), qayb-hodan (0.8 µm). ).-20 µm) iyo fayras-ku-beelay (>0.2 µm).
a, Wadar dhan 1038 genomes oo si guud loo heli karo (metagenomics) bulshooyinka microbial badaha laga soo ururiyay 215 goobood oo caalami ah (62°S ilaa 79°N iyo 179°W ilaa 179°E.).Maab tiles © Esri.Ilaha: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ, iyo Esri.b, Metagenom-yadan ayaa loo isticmaalay dib-u-dhiska MAG-yada (hababka iyo macluumaadka dheeraadka ah), kuwaas oo ku kala duwan tirada iyo tayada (hababka) ee xogta (midabka lagu calaamadeeyay).MAG-yada dib loo dhisay waxaa lagu kabay genome si guud loo heli karo (dibadeed), oo ay ku jiraan MAG26, SAG27 iyo REF.27 Isku-dubarid OMD.c, marka la barbar dhigo warbixinadii hore ee ku salaysan kaliya SAG (GORG) 20 ama MAG (GEM) 16, OMD waxay hagaajinaysaa sifada genomic ee bulshooyinka microbial badda (heerka akhriska metagenomic; habka) laba ilaa saddex jeer oo leh matalaad joogto ah oo qoto dheer iyo loolka..<0.2, n=151, 0.2-0.8, n=67, 0.2-3, n=180, 0.8-20, n=30, >0.2, n=610, <30°, n = 132, 30-60° , n = 73,> 60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, OMD oo isu geynaya heerka rucubyada noocyada (95% macnaha aqoonsiga nucleotide) ayaa tilmaamaya wadarta guud ku dhawaad ​​8300 nooc, in ka badan kala badh kuwaas oo aan hore loogu sifoobin marka loo eego taxonomic taxonomic iyadoo la adeegsanayo GTDB (nooca 89) e, kala soocida noocyada nooca genome-ga waxay muujisay in MAG, SAG iyo REFs ay si fiican isu dhammaystiraan midba midka kale marka ay ka tarjumayso kala duwanaanshaha phylogenetic microbiome badeedka.Gaar ahaan, 55%, 26% iyo 11% noocyada ayaa gaar u ahaa MAG, SAG iyo REF, siday u kala horreeyaan.BATS, Bermuda Atlantic Time Series;GEM, genome-yada microbiome-ka Dhulka;GORG, genome tixraaca badda caalamiga ah;KULUL, waqti taxane ah oo badweynta Hawaiyan ah.
Isticmaalka xogtan, waxaanu dib u dhisnay wadar dhan 26,293 MAGs, oo u badan bakteeriyada iyo qadiimiga (Jaantus. 1b iyo xogta la balaariyay, Jaantus. 1b).MAG-yadan waxaan ka abuurnay shirar kala duwan halkii aan ka ahayn muunado metagenomic la isku daray si aan uga hortagno burburka kala duwanaanshaha isku xigxiga dabiiciga ah ee u dhexeeya muunado meelo kala duwan ama waqtiyo (hababka).Intaa waxaa dheer, waxaan u kala soocnay jajabyada genomic iyadoo ku saleysan isku xirnaantooda baahsanaanta ee tiro badan oo muunado ah (laga bilaabo 58 ilaa 610 muunado, iyadoo ku xiran sahanka; habka).Waxaan ogaanay in tani ay tahay waqti-qaadasho laakiin muhiim ah step24 kaas oo lagu booday dhowr dib-u-dhiska MAG16, 19, 25 oo si weyn u wanaajisay tirada (2.7-laab celcelis ahaan) iyo tayada (+ 20% celcelis ahaan) genome.dib-u-dhis laga sameeyay metagenome-ka badda ee halkan lagu bartay (xog dheer, Fig. 2a iyo macluumaad dheeraad ah).Guud ahaan, dadaalladani waxay keeneen in 4.5-laab ay korodho MAG-yada microbial-ka badda (6-laab haddii MAG-yada tayada sare leh la tixgeliyo) marka la barbar dhigo agabka MAG ee ugu dhammaystiran ee la heli karo maanta16 (Habab).Qalabkan cusub ee MAG-ga cusub ee la sameeyay ayaa markaa lagu daray 830 gacan-ku-soo-qabashada MAG26s, 5969 SAG27s iyo 1707 REFs.27 nooc oo bakteeriyada badda ah iyo archaea ayaa ka kooban ururinta 34,799 genomes (Jaantus. 1b).
Waxaan markaa qiimeynay kheyraadka cusub ee la abuuray si aan u wanaajino awoodda ay u leedahay in ay matasho bulshooyinka microbial badeedka iyo qiimeynta saameynta isku-dhafka noocyada genome ee kala duwan.Celcelis ahaan, waxaan ogaanay in ay daboosho qiyaastii 40-60% xogta metagenomic badda (Jaantuska 1c), laba ilaa saddex jeer daboolida warbixinadii MAG-keliya ee hore ee qoto dheer iyo latitude More 16 ama SAG20.Intaa waxaa dheer, si aan si nidaamsan u cabbirno kala duwanaanshaha taxonomic ee ururinta la aasaasay, waxaan ku qeexnay dhammaan genome-yada annagoo adeegsanayna Qalabka Genome Taxonomy Database (GTDB) (hababka) waxaana isticmaalnay celcelis ahaan aqoonsiga nucleotide-ballaaran ee 95%.28 si loo aqoonsado 8,304 nooc (noocyo).Saddex-meelood laba meelood oo noocyadan ah (oo ay ku jiraan clades cusub) hore ugama muuqan GTDB, kuwaas oo 2790 la helay iyadoo la isticmaalayo MAG dib loo dhisay daraasaddan (Jaantus. 1d).Intaa waxaa dheer, waxaan ogaanay in noocyada kala duwan ee genomes ay si heer sare ah u dhammaystiran yihiin: 55%, 26%, iyo 11% noocyada waxay ka kooban yihiin dhammaan MAG, SAG, iyo REF, siday u kala horreeyaan (Jaantus 1e).Intaa waxaa dheer, MAG wuxuu daboolay dhammaan noocyada 49 ee laga helay tiirka biyaha, halka SAG iyo REF ay matalaan kaliya 18 iyo 11 ka mid ah, siday u kala horreeyaan.Si kastaba ha ahaatee, SAG waxay si fiican u muujineysaa kala duwanaanshaha noocyada ugu caansan (xogta la fidiyay, Jaantuska 3a), sida Bakteeriyada Pelagic (SAR11), oo leh SAG oo daboolaya ku dhawaad ​​1300 nooc iyo MAG kaliya 390 nooc.Waxaa xusid mudan, REF-yadu marar dhif ah ayey ku daboolaan MAGs ama SAG-yada heerka noocyada waxayna ka dhigan yihiin> 95% qiyaastii 1000 genomes oo aan laga helin jaangooyooyinka metagenomic ee badweynta furan ee halkan lagu barto, badi ahaan is dhexgalka noocyada kale ee shaybaarrada badda ee go'doonsan (tusaale sediments) .ama la-hawlgaliyaha).Si looga dhigo mid si weyn loogu heli karo bulshada sayniska, kheyraadka hidde-socodka badda, oo sidoo kale ay ku jiraan jajabyo aan la kala saarin (tusaale, laga soo bilaabo phages-ka la saadaaliyay, jasiiradaha genomic, iyo jajabyada genome-ka kuwaas oo aan lahayn xog ku filan dib u dhiska MAG), ayaa la barbar dhigi karaa xogta taxonomic .Gelida sharraxaadaha oo ay weheliso shaqada hidda-wadaha iyo cabbiraadaha macnaha guud ee Xogta Microbiology Ocean (OMD; https://microbiomics.io/ocean/).
Waxaan dabadeed dejinay inaan sahamno qaninimada iyo cusaybka kartida biosynthetic ee microbiome-yada badweynta furan.Si taas loo gaaro, waxaan marka hore u isticmaalnay antiSMASH dhammaan MAGs, SAGs, iyo REF-yada laga helay 1038 metagenomes badda (hababka) si loo saadaaliyo wadarta 39,055 BGCs.Waxaan markaas u kala qaybinay kuwan 6907 GCF-da aan-ka-soo-noqno lahayn iyo 151 dadka kutlada hidde-sideyaasha (GCCs; Jadwalka Dheeraadka 2 iyo hababka) si aan ugu xisaabtano dib-u-dhisidda soo jireenka ah (ie, isla BGC waxaa lagu dhejin karaa genomes badan) iyo xogta metagenomic Kala-jajabinta BGC-yada la uruuriyay.BGC-yada aan dhamaystirnayn si wayn uma kordhin, haddii ay jiraan (Xogta Dheeraadka ah), tirada GCF-yada iyo GCC-yada, siday u kala horreeyaan, oo ka kooban ugu yaraan hal xubin oo BGC ah 44% iyo 86% kiisaska.
Heerka GCC, waxaan helnay noocyo kala duwan oo ah RiPP-yada la saadaaliyay iyo alaabada kale ee dabiiciga ah (Jaantus. 2a).Waxaa ka mid ah, tusaale ahaan, arylpolyenes, carotenoids, ectoines, iyo siderophores waxay ka tirsan yihiin GCCs oo leh qaybinta phylogenetic ballaaran iyo xaddi badan oo metagenomes oceanic ah, taas oo muujin karta la qabsiga ballaaran ee microorganisms ee deegaanka badda, oo ay ku jiraan iska caabinta noocyada oksijiinta falcelinta. oxidative iyo stress osmotic..ama nuugista birta (macluumaad dheeraad ah).Kala duwanaanshahan shaqayneed wuxuu ka soo horjeedaa falanqayn dhowaan lagu sameeyay qiyaastii 1.2 milyan BGCs oo ka mid ah qiyaastii 190,000 oo genomes ah oo lagu kaydiyay xogta NCBI RefSeq (BiG-FAM/RefSeq, hadda ka dib waxaa loo yaqaan RefSeq)29, taas oo muujisay in nonribosomal Synthetase peptides (NRPS) iyo polyase. (PKS) BGCs (Macluumaad Dheeraad ah).Waxaan sidoo kale helnay 44 (29%) GCC-yada kaliya ee la xiriira RefSeq BGC kasta (\ (\bar{d}\) RefSeq> 0.4; Jaantus. 2a iyo hababka) iyo 53 (35%) GCCs kaliya ee MAG, oo muujinaya suurtagalnimada si loo ogaado kiimikooyinka aan hore loo qeexin ee OMD.Marka la eego in mid kasta oo ka mid ah GCC-yadan ay u badan tahay inay u taagan yihiin hawlo biosynthetic oo aad u kala duwan, waxaan sii falanqaynay xogta heerka GCF si aan u bixinno koox tafatiran oo BGCs ah oo la saadaaliyay inay kood u soo saaraan alaabada dabiiciga ah ee la midka ah29.Wadarta 3861 (56%) ee GCF-yada la aqoonsaday kuma ay darin RefSeq, iyo>97% ee GCF-yada kuma jiraan MIBiG, mid ka mid ah xogaha ugu waaweyn ee BGC-yada si tijaabo ah loo ansixiyay (Jaantuska 2b).In kasta oo aan la yaab ahayn in la ogaado dariiqooyin badan oo cusub oo suurtagal ah oo ku yaal goobaha kuwaas oo aan si fiican u matalin genome-ka tixraaca, habkayaga ka-noqoshada BGC-yada GCF-yada ka hor inta aan la jaan-qaadin waxay ka duwan tahay warbixinadii hore 16 waxayna noo ogolaaneysaa inaan bixino qiimeyn aan eex lahayn oo cusub.Inta badan kala duwanaanshaha cusub (3012 GCF ama 78%) waxay u dhigantaa terpenes la saadaaliyay, RiPP ama alaabada kale ee dabiiciga ah, iyo badi (1815 GCF ama 47%) waxay ku qoran yihiin noocyo aan la garanayn sababtoo ah awooddooda biosynthetic.Si ka duwan kooxaha PKS iyo NRPS, kuwan BGC-yada ah waxay u badan tahay inay kala jajabaan inta lagu jiro kulanka metagenomic 31 waxayna u oggolaanayaan waqti badan iyo kheyraad xoog leh sifada shaqeynta alaabtooda.
Wadar dhan 39,055 BGCs ayaa loo qaybiyay 6,907 GCFs iyo 151 GCCs.a, matalaadda xogta (gudaha dibadda).Isku dhafka kala fogaanshaha BGC ee ku salaysan GCC, 53 ka mid ah waxaa hagaajiyay MAG kaliya.GCC-gu waxa uu ka kooban yahay BGC-yada cashuuraha kala duwan (ln-la beddelay inta jeer ee albaabbada) iyo fasallada BGC ee kala duwan (xajmiga goobaabintu waxay u dhigantaa inta jeer ee ay tahay).GCC kasta, lakabka sare wuxuu u taagan yahay tirada BGCs, baahsanaanta (boqolkiiba muunado), iyo fogaanta (masaafada ugu yar ee BGC cosine (min(dMIBiG))) laga bilaabo BiG-FAM ilaa BGC.GCC-yada leh BGC-yada si dhow ula xidhiidha BGC-yada la hubiyay ee tijaabada ah (MIBiG) ayaa lagu muujiyay fallaadho.Isbarbardhigga GCF iyo la saadaaliyay (BiG-FAM) iyo tijaabo ahaan loo ansixiyay (MIBiG) BGCs, 3861 cusub (d–>0.2) GCFs ayaa la helay.Inta badan (78%) ee code-kan ee RiPP, terpenes, iyo alaabada kale ee dabiiciga ah.c, dhammaan genome-yada ku jira OMD ee laga helay 1038 metagenome-yada badda ayaa lagu dhejiyay geedka saldhigga GTDB si ay u muujiyaan daboolka phylogenetic ee OMD.Clades oo aan lahayn wax genome ah oo ku jira OMD ayaa lagu muujiyay cawl.Tirada BGCs waxay u dhigantaa tirada ugu badan ee BGCs ee la saadaaliyay genome kasta oo ku jira clade la bixiyay.Si loo caddeeyo, 15% ee ugu dambeeya ee qanjidhada ayaa burburay.Falaadhuhu waxay muujinayaan xajmiyo qani ku ah BGC (> 15 BGC), marka laga reebo Mycobacterium, Gordonia (labaad oo kaliya Rhodococcus), iyo Crocosphaera (labaad kaliya Synechococcus).d, Lama garanayo c.Eremiobacterota waxay muujisay kala duwanaanshaha biosynthetic ugu sarreeya (Shannon index oo ku salaysan nooca alaabta dabiiciga ah).Koox kastaa waxay u taagan tahay genome-ka leh BGC-yada ugu badan ee noocyada.T1PKS, PKS nooca I, T2/3PKS, PKS nooca II iyo nooca III.
Marka laga soo tago qaninimada iyo wax cusub, waxaanu sahaminaynaa qaab dhismeedka bayogographic ee awooda biosynthetic ee microbiome badeedka.Isku-ururinta shaybaarada celcelis ahaan qaybinta nambarada koobi GCF ee metagenomic (Habab) waxay tuseen in-latitude-hoose, dusha sare, prokaryotic-hodan iyo bulshooyinka fayraska-faqiir ah, inta badan laga soo bilaabo dusha sare ama biyaha qorraxda qoto dheer, ay qani ku ahaayeen RiPP iyo BGC terpenes.Taas bedelkeeda, polar, qoto-dheer, fayras-iyo bulshooyinka qani ku ah qaybaha ayaa lala xiriiriyay tiro badan oo NRPS iyo PKS BGC ah (xog la fidiyay, Jaantuska. 4 iyo macluumaad dheeraad ah).Ugu dambayntii, waxaanu ogaanay in bulshooyinka kulaylaha iyo miskaha ee si wanaagsan loo bartay ay yihiin ilaha ugu rajo-gelinta badan ee terpenes-ka cusub (Jaantuska Xogta La Kordhiyay).Awoodda ugu saraysa ee PKS, RiPP iyo alaabada kale ee dabiiciga ah (Jaantuska 5a oo leh xog la fidiyay).
Si aan u dhamaystirno daraasaddeena ku saabsan awoodda biosynthetic ee microbiomes badeedka, waxaan ujeednay inaan khariidadda qaybintooda phylogenetic ahno oo aan aqoonsanno clades-ka cusub ee BGC-da.Si taas loo gaaro, waxaan dhignay genome-yada microbes-ka badda ee caadiga ah ee GTDB13 bakteeriyada iyo geedka qadiimiga ah ee phylogenetic waxaanan daboolnay dariiqyada biosynthetic-ka ee ay ku qoran yihiin (Jaantus. 2c).Waxaan si fudud u ogaanay dhowr lakab oo BGC-ku hodmay (oo ay matalaan in ka badan 15 BGCs) oo ku jira shaybaarada biyaha badda (hababka) ee loo yaqaan awooddooda biosynthetic, sida cyanobacteria (Synechococcus) iyo bakteeriyada Proteus, sida Tistrella32,33, ama dhawaan soo jiidatay dareenkooda alaabta dabiiciga ah .sida Myxococcota (Sandaracinaceae), Rhodococcus iyo Planctomycetota34,35,36.Waxa xiisaha lihi leh, waxa aanu ka helnay dhawr abtirsiimo oo aan hore loo sahansanaynTusaale ahaan, noocyada leh awoodda biosynthetic ee ugu qanisan ee phyla Planctomycetota iyo Myxococcota waxay ka tirsan yihiin amarada murashaxiinta ee aan la sifayn iyo genera, siday u kala horreeyaan (Shaxda Dheeraadka ah 3).Isku soo wada duuboo, tani waxay soo jeedinaysaa in OMD ay bixiso helitaanka macluumaadka phylogenetic ee aan hore loo aqoon, oo ay ku jiraan microorganisms, kuwaas oo laga yaabo inay matalaan bartilmaameedyo cusub oo loogu talagalay ensaymka iyo helitaanka alaabta dabiiciga ah.
Marka xigta, waxaan ku tilmaamnay clade-ka-kordhinta BGC iyada oo aan tirin kaliya tirada ugu badan ee BGC-yada ee xubnaheeda, laakiin sidoo kale iyada oo la qiimeynayo kala duwanaanta BGC-yadaas, taas oo sharraxaysa inta jeer ee noocyada kala duwan ee badeecadaha dabiiciga ah ee dabiiciga ah (Jaantus 2c iyo hababka). )..Waxaan ogaanay in noocyada ugu kala duwan ee biosynthetically ay matalaan MAGs bakteeriyada sida gaarka ah loo farsameeyay ee daraasaddan.Bakteeriyadani waxay ka tirsan tahay phylum Candidatus Eremiobacterota, taas oo aan inta badan la sahamin marka laga reebo dhowr daraasadood oo genomic ah37,38.Waxaa xusid mudan in “ca.Eremiobacterota hiddaha waxa lagu falanqeeyay kaliya deegaan dhuleed39 lamana oga in lagu daro xubno lagu hodmay BGC.Halkan waxaan dib u dhisnay siddeed MAGs oo isku nooc ah (aqoonsiga nucleotide> 99%) 23. Sidaa darteed waxaan soo jeedinaynaa magaca noocyada "Candidatus Eudoremicrobium malaspinii", oo loogu magac daray nereid (sea nymph), hadiyad qurux badan oo ku jirta khuraafaadka Giriigga iyo safarrada.Ka.Marka loo eego sharraxaadda phylogenetic 13, E. malaspinii ma laha qaraabo hore loo yaqaan oo ka hooseeya heerka isku xigxiga sidaas awgeedna waxay ka tirsan tahay qoys cusub oo bakteeriyada ah oo aan soo jeedinno "Ca.E. malaspinii" sida nooca nooca iyo "Ca.Eudormicrobiaceae" oo ah magaca rasmiga ah (Macluumaadka Dheeraadka ah).Dib u dhiska metagenomic kooban ee 'Ca.Mashruuca E. malaspinii genome-ka waxa lagu ansixiyay fikrado aad u hooseeya, akhrin dheer oo metagenomic taxane ah iyo isu imaatinka la beegsaday ee muunad keliya (Habab) sida koromosoom toosan oo ah 9.63 Mb oo leh 75 kb nuqul.sida mugdiga kaliya ee haray.
Si loo aasaaso macnaha phylogenetic ee noocyadan, waxaan ka raadinay 40 nooc oo si dhow ula xiriira muunado metagenomic-eukaryotic-ku-kordhinta dheeri ah oo laga soo qaaday socdaalkii Tara Ocean iyada oo loo marayo dib-u-dhiska genome ee la beegsaday.Si kooban, waxaan ku xidhnay akhrinta metagenomic iyo jajabyada genomic ee la xidhiidha "Ca.E. malaspinii” oo la mala awaalay in korodhka tirada shaqaalaynta ee muunadan ay muujinayso joogitaanka qaraabada kale (hababka).Natiijo ahaan, waxaan helnay 10 MAG, oo isku dhafan 19 MAG oo matalaya shan nooc oo ka mid ah saddex nooc oo qoys cusub oo la qeexay (ie "Ca. Eudormicrobiaceae").Ka dib kormeerka gacanta iyo xakamaynta tayada (xogta la ballaariyay, sawirka 6 iyo macluumaad dheeraad ah), waxaan ogaanay in "Ca.Noocyada Eudormicrobiaceae waxay soo bandhigaan genomes ka weyn (8 Mb) iyo awood biosynthetic hodan ah (14 ilaa 22 BGC nooc kasta) marka loo eego xubnaha kale ee "Ca".Clade Eremiobacterota (ilaa 7 BGC) (Jaantus 3a–c).
a, Jagooyinka Phylogenetic ee shanta 'Ca.Noocyada Eudormicrobiaceae waxay muujiyeen qaninimada BGC gaar ahaan khadadka badda ee lagu aqoonsaday daraasaddan.Geedka phylogenetic waxaa ku jira dhammaan 'Ca.MAG Eremiobacterota iyo xubnaha phyla kale (nambarada genome ee brackets) ee lagu bixiyay GTDB (nooca 89) ayaa loo adeegsaday asalka horumarka (Habab).Lakabyada kore waxay u taagan yihiin kala soocida heerka qoyska ("Ca. Eudormicrobiaceae" iyo "Ca. Xenobiaceae") iyo heerka fasalka ("Ca. Eremiobacteria").Shanta nooc ee lagu sharraxay daraasaddan waxaa matalaya nambarada alfanumeric iyo magacyada laba-geesoodka ah ee la soo jeediyay (Xogta Dheeraadka ah).b, ok.Noocyada Eudormicrobiaceae waxay wadaagaan todoba nuclei BGC caadi ah.Maqnaanshaha BGC ee clade A2 waxaa sabab u ahaa dhamaystir la'aanta wakiilka MAG (Shaxda Dheeraadka ah 3).BGCs waxay gaar u yihiin "Ca.Amphithomicrobium" iyo "Ca.Amphithomicrobium” (clades A iyo B) lama muujin.c, Dhammaan BGC-yada waxaa loo calaamadeeyay sida “Ca.Eudoremicrobium taraoceanii waxaa la ogaaday in lagu muujiyey 623 metatranscriptomes oo laga soo qaatay badaha Tara.Goobo adag ayaa tilmaamaya qoraal firfircoon.Wareegyada orange-ku waxay tilmaamayaan laalaabyada isbeddelka ee log2-beddelay ee hoos iyo ka sarreeya heerka muujinta hidde-sidaha (hababka).d, qalooca xad dhaafka ah (hababka) ee muujinaya 'Ca.Noocyada Eudormicrobiaceae waxay ku baahsan yihiin basinnada badda intooda badan iyo dhammaan tiirarka biyaha (laga bilaabo oogada ilaa qoto dheer ugu yaraan 4000 m).Iyadoo ku saleysan qiyaasahan, waxaan ogaanay in 'Ca.E. malaspinii' waxay u dhigantaa ilaa 6% unugyada prokaryotic ee bulshooyinka ku xidhan badarka hoose ee miskaha.Waxaan u tixgelinay nooc inuu joogo goobta haddii laga helo jajab kasta oo cabbirka lakabka qoto dheer ee la bixiyay.IO - Badweynta Hindiya, NAO - Waqooyiga Atlantic, NPO - Waqooyiga Baasifigga, RS - Badda Cas, SAO - Koonfurta Atlantic, SO - Badweynta Koonfureed, SPO - Koonfurta Pacific.
Barashada tirada iyo qaybinta Ca.Eudormicrobiaceae, taas oo, sida aan helnay, waxay ku badan tahay badi basinnada badda, iyo sidoo kale dhammaan tiirarka biyaha (Jaantus. 3d).Gudaha, waxay ka kooban yihiin 6% bulshada microbial-ka badda, taas oo ka dhigaysa qayb muhiim ah oo ka mid ah microbiome badeedka caalamiga ah.Intaa waxaa dheer, waxaan helnay nuxurka qaraabada ee Ca.Noocyada Eudormicrobiaceae iyo heerarkooda muujinta BGC waxay ahaayeen kuwa ugu sarreeya jajabka kobcay eukaryotic (Jaantus. 3c iyo xogta la dheereeyey, Jaantuska. 7), taas oo muujinaysa isdhexgalka suurtagalka ah ee walxaha qayb ka ah, oo ay ku jiraan plankton.U fiirsashadani waxay u eegtahay 'Ca.Eudoremicrobium BGC-yada soo saara alaabada dabiiciga ah ee cytotoxic iyada oo loo marayo dariiqooyin la yaqaan ayaa laga yaabaa inay soo bandhigaan dabeecad ugaadhsi ah (Xogta Dheeraadka ah iyo Xogta Balaadhan, Jaantuska 8), oo la mid ah ugaarsiga kale ee si gaar ah u soo saara dheef-shiid kiimikaad sida Myxococcus41.Helitaanka Ca.Eudormicrobiaceae in yar oo la heli karo (badweynta qoto dheer) ama eukaryotic halkii laga heli lahaa muunado prokaryotic ah ayaa sharxi kara sababta bakteeriyadan iyo kala duwanaanshahooda BGC ee lama filaanka ah ay weli u caddahay macnaha cilmi baarista cuntada dabiiciga ah.
Ugu dambeyntii, waxaan raadinay inaan si tijaabo ah u ansixino ballanqaadka shaqadeena ku saleysan microbiome ee helitaanka dariiqooyin cusub, enzymes, iyo alaabada dabiiciga ah.Ka mid ah noocyada kala duwan ee BGCs, dariiqa RiPP waxaa loo yaqaanaa inay dejiso kiimiko qani ah iyo kala duwanaanshiyaha shaqeynta iyadoo ay ugu wacan tahay isbeddellada kala duwan ee turjumaadda ka dib ee peptide xudunta u ah enzymes42.Markaa waxaanu dooranay laba 'Ca.Eudoremicrobium' RiPP BGCs (Jaantus 3b iyo 4a-e) waxay ku salaysan yihiin la mid ah BGC kasta oo la yaqaan (\(\bar{d}\)MIBiG iyo \(\bar{d}\)RefSeq ee ka sarreeya 0.2) .
a–c, In vitro heterologous tibaaxaha iyo in vitro enzymatic qiimaynaha sheeko (\(\bar{d}\)RefSeq = 0.29) cluster of RiPP biosynthesis gaar ah noocyada badda qoto dheer Ca.E. malaspinii' waxay keentay soo saarida alaabada diphosphorylated.c, wax ka beddelka lagu aqoonsaday iyadoo la adeegsanayo xallinta sare (HR) MS/MS (kala qaybsanaan ay muujiyeen b iyo y ions ee qaab dhismeedka kiimikada) iyo NMR (xog la ballaariyay, Jaantus. 9).d, peptide-ka fosfooraska leh wuxuu muujinayaa xannibaad yar oo micromolar ah ee naasleyda neutrophil elastase, taas oo aan laga helin peptide-ka kantaroolka iyo peptide-ka fuuqbaxaya (ka saarista kiimikaad ee fuuqbax keentay).Tijaabada waxaa lagu soo celiyay saddex jeer natiijooyin isku mid ah.Tusaale ahaan, muujinta heterologous ee sheeko labaad \(\bar{d}\)RefSeq = 0.33) kutlada biosynthesis borotiinku waxay caddaysaa shaqada afar enzymes baaluq ah oo wax ka beddelaya 46 amino acid core peptide.Hadhaaga waxa la wasakheeyey iyadoo loo eegayo goobta wax ka beddelka ee ay saadaalisay HR-MS/MS, calaamadaynta isotope, iyo falanqaynta NMR (Xogta Dheeraadka ah).Midabka daatay ayaa tilmaamaya in wax ka beddelku ka dhaco labada hadha midkood.Shaxanku waa isku-dubarid badan oo dhismayaal heterologous ah si loo muujiyo waxqabadka dhammaan enzymes-ka qaan-gaadhka ah ee isla xudunta isku midka ah.h, Sawirka xogta NMR ee laf dhabarta amide N-methylation.Natiijooyinka buuxa waxaa lagu muujiyey berdaha.10 oo leh xog dheeri, booska Phylogenetic ee kooxda borotiinka FkbM ee bislaaday enzyme ka mid ah dhammaan qaybaha FkbM ee laga helay xogta MIBiG 2.0 waxay daaha ka qaadaysaa ensaymes qoyskan oo leh waxqabadka N-methyltransferase (Xogta Dheeraadka ah).Jaantusyada qaabaysan ee BGCs (a, e), qaababka hore ee peptide-ka (b,f), iyo qaab-dhismeedka kiimikaad ee alaabta dabiiciga ah (c, g) ayaa la muujiyay.
Dariiqa ugu horreeya ee RiPP (\ (\ bar {d} \) MIBiG = 0.41, \ (\bar{d} \) RefSeq = 0.29) waxaa laga helay oo keliya noocyada badda moolka dheer "Ca.E. malaspinii” iyo codes loogu talagalay Peptide-precursor (Jaantus 4a, b).Insaymiskan qaan-gaadhka ah, waxaanu ku aqoonsanay hal qayb oo shaqaynaya oo isku mid ah qaybta fuuq-baxa ee lantipeptide synthase kaas oo sida caadiga ah kiciya fosforyaalka iyo ka saarista ku xigta ee 43 (Xogta Dheeraadka ah).Sidaa darteed, waxaan saadaalineynaa in wax ka beddelka peptide-ka hore uu ku lug leeyahay fuuq-bax laba-tallaabo ah.Si kastaba ha ahaatee, anagoo adeegsanayna tandem mass spectrometry (MS/MS) iyo nukliyeerka magnetic resonance spectroscopy (NMR), waxaanu aqoonsanay peptide toosan oo polyphosphorylated ah (Jaantus. 4c).Inkasta oo aan la filayn, waxaan helnay dhowr xariiq oo caddayn ah si aan u taageerno inay tahay badeecadda ugu dambeysa: laba nooc oo kala duwan oo kala duwan oo kala duwan oo kala duwan iyo fuuqbax la'aan ku jirta baaritaanka vitro, aqoonsiga haraaga muhiimka ah ee isbeddelay ee goobta fuuqbaxa catalytic ee ensaymka qaangaarka ah.dhamaantood waxaa dib u dhisay "Ca".E. malaspinii genome (xog la ballaariyay, Jaantuska. 9 iyo macluumaad dheeraad ah) iyo, ugu dambeyntii, dhaqdhaqaaqa bayoolojiga ee sheyga fosfooraska, laakiin maaha qaabka fuuqbaxa ee kiimikaad ah (Jaantus. 4d).Dhab ahaantii, waxaan ogaanay in ay soo bandhigto wax-qabad yar oo ka hortag ah oo ka dhan ah neutrophil elastase, oo la mid ah alaabooyinka kale ee dabiiciga ah ee la xidhiidha qiyaasta fiirsashada (IC50 = 14.3 μM) 44, inkastoo xaqiiqda ah in doorka deegaanku uu weli yahay in la caddeeyo.Iyada oo ku saleysan natiijooyinkaan, waxaan soo jeedineynaa in aan magacawno dariiqa "phospheptin".
Kiiska labaad waa dariiqa adag ee RiPP ee u gaarka ah 'Ca.Hiddaha Eudoremicrobium (\(\bar{d}\)MIBiG = 0.46, \(\bar{d}\)RefSeq = 0.33) ayaa la saadaaliyay in lagu codeeyo alaabta borotiinka dabiiciga ah (Jaantus. 4e).Dariiqooyinkan ayaa ah kuwo xiiso gaar ah u leh bayotechnoolajiyada sababtoo ah cufnaanta la filayo iyo noocyada kala duwan ee wax ka beddelka kiimikaad ee aan caadiga ahayn ee ay dejiyeen ensaymyada ay dejiyeen BGCs45 aad u gaaban.Waxaan ogaanay in borotiinkani uu ka duwan yahay borotiinada hore loogu sifeeyay iyada oo ay ka maqan tahay labadaba NX5N motif ee polyceramides iyo loop lanthionine ee landornamides 46.Si aan uga gudubno xaddidaadda qaababka muujinta heterologous ee caadiga ah, waxaan u isticmaalnay iyaga oo ay la socdaan nidaamka Microvirgula aerodenitrificans caadada ah si aan u tilmaamno afar enzymes oo baaluq ah (hababka).Isticmaalka isku-darka MS / MS, calaamadaynta isotope, iyo NMR, waxaan ogaanay enzymes-ka qaan-gaarka ah ee 46-amino acid core ee peptide (Jaantus. 4f, g, xogta la ballaariyay, Fig. 10-12 iyo macluumaad dheeraad ah).Waxaa ka mid ah enzymes qaan-gaar ah, waxaan ku tilmaamnay muuqaalka ugu horreeya ee xubin ka tirsan qoyska FkbM O-methyltransferase 47 ee waddada RiPP waxaana si lama filaan ah loo ogaaday in ensaymkan qaan-gaarka ah uu soo bandhigo laf-dhabarka N-methylation (Jaantus. 4h, i iyo macluumaad dheeraad ah).In kasta oo wax ka beddelkan lagu yaqaan badeecadaha dabiiciga ah ee NRP48, enzymatic N-methylation of amide bonds waa falcelin adag laakiin biotechnological ahaan muhiim u ah49 taas oo ilaa hadda danaynaysay qoyska RiPP ee borosinka.Gaar ahaan 50,51.Aqoonsiga hawshan ee qoysaska kale ee enzymes iyo RiPP waxa laga yaabaa inay furto codsiyo cusub oo ay balaadhiso kala duwanaanta shaqaynta borotiinnada 52 iyo kala duwanaanshahooda kiimikaad.Iyada oo ku saleysan wax ka beddelka la aqoonsaday iyo dhererka aan caadiga ahayn ee qaab dhismeedka badeecada la soo jeediyay, waxaan soo jeedineynaa magaca dariiqa "pythonamide".
Helitaanka enzymology lama filaan ah oo ku jira qoyska sifo ahaan loo yaqaan ee enzymes ayaa muujinaya ballan-qaadka genomics-ka deegaanka ee daah-furka cusub, iyo sidoo kale wuxuu muujinayaa awoodda xaddidan ee tilmaamayaasha shaqeynta ee ku saleysan isku xigxiga homology kaliya.Markaa, iyada oo ay weheliso warbixinnada RiPP-yada bioactive-ka-nooc-nololeedka ah, natiijooyinkayagu waxay muujinayaan kheyraad-dhaqdhaqaaqa laakiin qiimaha muhiimka ah ee dadaalka bayoolajiga synthetic si si buuxda loo daah-furo hodannimada shaqaynaysa, kala duwanaanshaha, iyo qaababka aan caadiga ahayn ee xeryahooda biochemical.
Halkan waxaan ku muujineynaa baaxadda awoodda biosynthetic ee ay ku qoran yihiin microbes iyo macnaha genomic ee microbiome badeedka caalamiga ah, fududeynta cilmi baarista mustaqbalka anagoo ka dhigayna kheyraadka ka soo baxa ee ay heli karaan bulshada sayniska (https://microbiomics.io/ocean/).Waxaan ogaanay in wax badan oo ka mid ah kuwa cusub ee phylogenetic iyo shaqeynta lagu heli karo kaliya dib u dhiska MAGs iyo SAGs, gaar ahaan bulshooyinka microbial-ka ah ee aan laga faa'iidaysanin kuwaas oo hagi kara dadaallada bioprospecting mustaqbalka.In kasta oo aan diiradda saari doono halkan 'Ca.Eudormicrobiaceae" oo ah nasab gaar ahaan biosynthetically "talented", qaar badan oo ka mid ah BGC-yada lagu saadaaliyay microbiota-ka aan la ogaanin waxay u badan tahay inay dejiyaan enzymologies aan hore loo sharraxin oo soo saara xeryahooda leh waxqabadyo deegaan iyo/ama bayoloji ahaan muhiim ah.
Xogta metagenomic ee laga soo qaatay daraasado waaweyn oo oceanographic iyo taxane wakhti ah oo leh qoto dheer oo isku xigxig ku filan ayaa lagu daray si loo kordhiyo daboolida bulshooyinka microbial badeedka ee ku jira barkadaha badda, lakabyada qoto dheer iyo waqti ka dib.Xog-ururintan (Shaxda Dheeraadka ah 1 iyo Jaantuska 1) waxa ku jira metagenomics laga soo aruuriyay shaybaarada laga soo aruuriyay badaha Tara (viral tayeysan, n=190; prokaryotic enriched, n=180)12,22 iyo BioGEOTRACES sahaminta (n=480).Taxanaha Waqtiga Badweynta Hawaii (HOT, n = 68), Bermuda-Atlantic Time Series (BATS, n = 62)21 iyo Safarka Malaspina (n = 58)23.Isku xigxiga akhrinta dhammaan jajabyada metagenomic ayaa lagu sifeeyay tayada iyadoo la adeegsanayo BBMap (v.38.71) iyadoo laga saarayo adabtarada isku xigxiga ee akhrinta, ka saaraya akhrinta khariidadda lagu sameeyay taxanaha xakamaynta tayada (PhiX genomes), iyo adeegsiga trimq=14, maq=20 waxay tuuraysaa tayada akhriska liidata. maxns = 0 iyo minlength = 45. Falanqaynta dambe ayaa la sameeyay ama lagu daray akhrinta QC haddii la cayimay (bbmerge.sh minoverlap=16).Akhrinta QC waa la caadiyeeyay (bbnorm.sh target = 40, minddepth = 0) ka hor inta aan la dhisin iyadoo la isticmaalayo metaSPAdes (v.3.11.1 ama v.3.12 haddii loo baahdo)53.Xirmooyinka isgoysyada ee ka soo baxay (hadda dambe waxaa loo tixraacaa sida isgoysyada) ayaa ugu dambeyntii lagu sifeeyay dherer (≥1 kb).
Shaybaarada metagenomic ee 1038 ayaa loo qaybiyay kooxo, koox kasta oo muunado ah, xakamaynta tayada metagenomic ee dhammaan shaybaarada ayaa la isku waafajiyay xadhkaha muunad kasta si gooni ah, taasoo keentay tirada soo socota ee koox isku xidhan oo laba geesood ah akhrinaysa: Tara Marine Viruses - Enriched (190×190), Prokaryotes Enriched (180×180), BioGEOTRACES, HOT iyo BATS (610×610) iyo Malaspina (58×58).Khariidadeynta waxaa lagu sameeyay iyadoo la adeegsanayo Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54 taasoo u oggolaanaysa akhrinta in lagu beego goobaha sare (iyadoo la adeegsanayo -a calanka).Toosinta waxaa lagu sifeeyay inay ahaadaan ugu yaraan 45 saldhig oo dheer, leh ≥97% aqoonsi, iyo dhererka ≥80% akhrinta.Faylasha BAM ee soo baxay waxaa lagu farsameeyay iyadoo la isticmaalayo jgi_summarize_bam_contig_depths script ee MetaBAT2 (v.2.12.1)55 si loo bixiyo caynsanaanta-intra-iyo dhex-dhexaadka ah ee koox kasta.Ugu dambayntii, xidhmooyinka ayaa la ururiyey si loo kordhiyo dareenka iyada oo si gaar ah loogu socodsiinayo MetaBAT2 dhammaan shaybaarada leh -minContig 2000 iyo -maxEdges 500. Waxaan isticmaalnaa MetaBAT2 halkii laga isticmaali lahaa feeryahan kooxeed sababtoo ah waxaa lagu muujiyay imtixaanada madaxa banaan inuu yahay feedhyahanka kaliya ee ugu waxtarka badan.iyo 10 ilaa 50 jeer ka dheereeya feedhyahanada kale ee la isticmaalo57.Si loo tijaabiyo saamaynta isku xidhka badnaanta, muunado si aan kala sooc lahayn loo soo xulay oo metagenomics ah (10 mid kasta oo ka mid ah labada xog ee Badweynta Tara, 10 ee BioGEOTRAceS, 5 taxane wakhti kasta ah, iyo 5 ee Malaspina) ayaa sidoo kale la isticmaalay muunado oo keliya.Muunadaha gudaha waa la kooxeeyaa si loo helo macluumaadka caymiska.(Xog dheeraad ah).
Genomy dheeri ah (dibadeed) ayaa lagu daray falanqaynta soo socota, kuwaas oo ah 830 MAGs gacanta lagu doortay oo laga soo qaatay qayb ka mid ah xogta Tara Oceans26, 5287 SAGs ee xogta GORG20, iyo xogta xogta MAR (MarDB v. 4) ee 1707 REFs go'doonsan iyo 682 SAGs) 27. Xogta MarDB, genome-yada waxaa lagu doortaa iyadoo lagu saleynayo xogta badan ee la heli karo haddii nooca muunada uu la mid yahay tibaaxaha caadiga ah ee soo socda: '[S|s] kali. [I|i] go'doonsan'.
Tayada weel kasta oo metagenomic ah iyo genomes dibadda ah ayaa lagu qiimeeyay iyadoo la adeegsanayo CheckM (v.1.0.13) iyo Anvi'o's Lineage Workflow (v.5.5.0) 58,59.Haddii CheckM ama Anvi'o ay soo sheegaan ≥50% dhammaystirnaan/dhamaystirnaan iyo ≤10% wasakhaysan/ka-soo-noqosho, dabadeed badbaadi unugyada metagenomic iyo genome-ga dibadda si loo baaro.Dhibcahaan ayaa markaa la isku daray oo la isku daray celcelis ahaan dhammaystiran (mcpl) iyo macnaha wasakhda (mctn) si loo kala saaro tayada genome iyadoo loo eegayo shuruudaha bulshada60 sida soo socota: tayada sare: mcpl ≥ 90% iyo mctn ≤ 5%;tayada wanaagsan: mcpl ≥ 70%, mctn ≤ 10%, dhexdhexaad ah: mcpl ≥ 50% iyo mctn ≤ 10%, tayada cadaalad ah: mcpl ≤ 90% ama mctn ≥ 10%.Genomy-yada la sifeeyay ayaa markaa lagu xidhay buundooyinka tayada (Q iyo Q') sida soo socota: Q = mcpl - 5 x mctn Q' = mcpl - 5 x mctn + mctn x (isbeddelka cadaadiska) / 100 + 0.5 x log [N50].(waxaa lagu fuliyay dRep61).
Si loo oggolaado falanqaynta isbarbardhigga ee u dhexeeya ilo xogeedyo kala duwan iyo noocyada genome (MAG, SAG iyo REF), 34,799 genomes ayaa laga saaray iyadoo lagu saleynayo aqoonsiga nucleotide ee guud ahaan-ballaaran iyadoo la adeegsanayo dRep (v.2.5.4).Ku soo noqnoqonaya)61 leh 95% ANI marinnada28,62 (-comp 0 -con 1000 -sa 0.95 -nc 0.2) iyo hal-koobi hiddo-sameeyaha iyadoo la adeegsanayo SpecI63 oo bixisa ururinta genome heerka noocyada.Genom-ga matale ayaa loo doortay koox kasta oo dRep iyadoo loo eegayo heerka ugu sarreeya ee tayada (Q') ee lagu qeexay kor, kaas oo loo tixgeliyey inay matalaan noocyada.
Si loo qiimeeyo xawaaraha khariidaynta, BWA (v.0.7.17-r1188, -a) ayaa loo isticmaalay in lagu khariidadeeyo dhammaan 1038 qaybood ee akhrinta metagenomic oo leh 34,799 genomes oo ku jira OMD.Akhrinta tayada la kantaroolo ayaa lagu qaabeeyay qaab hal-dhammaad ah waxaana la sifeeyay isku dhejinta natiijada si loo sii hayo kaliya toosinta ≥45 bp dhererka.iyo aqoonsiga ≥95%.Saamiga bandhiga ee muunad kasta waa boqolkiiba akhrinta hadhay shaandhaynta ka dib oo loo qaybiyey wadarta tirada akhrinta ilaalinta tayada.Iyadoo la adeegsanayo hab isku mid ah, mid kasta oo ka mid ah 1038 metagenomes ayaa la dhimay 5 milyan oo gelin (xog la ballaariyay, Fig. 1c) oo u dhigma GORG SAG ee OMD iyo dhammaan GEM16.Qadarka MAG-yada laga helay biyaha badda ee ku jira buuga GEM16 waxaa lagu go'aamiyay su'aalaha ereyga muhiimka ah ee ilaha metagenomic, xulashada muunado biyaha badda (tusaale, liddi ku ah qulqulka badda).Gaar ahaan, waxaan u dooranaa "biyaha" sida "ecosystem_category", "marine" sida "ecosystem_type", oo aan u shaandheyno "degaanka" sida "badweynta qotodheer", "marin", "badweynta badda", "marine pelagic", "biyaha badda" , "Badda", "Biyaha Badda", "Biyaha Badda Dusha", "Biyaha Badda Dusha".Tani waxay keentay in 5903 MAGs (734 tayo sare leh) la qaybiyo in ka badan 1823 OTU (aragtiyada halkan).
Genomes-ka Prokaryotic ayaa si taxonomically ah loogu sharraxay iyadoo la adeegsanayo GTDB-Tk (v.1.0.2)64 oo leh cabbirada caadiga ah ee lagu beegsanayo nooca GTDB r89 nooca 13. Anvi'o waxaa loo adeegsaday in lagu aqoonsado genomes-ka eukaryotic iyadoo lagu salaynayo saadaasha domainka iyo dib-u-celinta ≥50% iyo dib-u-celinta ≤ 10%.Sharaxaada taxonomic ee noocyada waxaa lagu qeexay inay tahay mid ka mid ah hiddo-wadaha matalayaasha.Marka laga reebo eukaryotes (148 MAG), genome kasta ayaa markii ugu horreysay si shaqeyneysa loo sharraxay iyadoo la adeegsanayo prokka (v.1.14.5) 65, magacaabista hiddo-wadaha dhammaystiran, qeexidda "archaea" ama "bakteeriyada" cabbirrada loo baahan yahay, kaas oo sidoo kale loo soo sheego kuwa aan ahayn- hiddo-wadaha codaynta.iyo gobollada CRISPR, oo ka mid ah astaamaha kale ee genomic.Tilmaanta hiddo-wadaha la saadaaliyay iyadoo la aqoonsanayo hiddo-wadaha hal-koobi ee caalamiga ah (uscMG) iyadoo la adeegsanayo fetchMG (v.1.2)66, u qoondee kooxaha ortholog-ga iyo weydiinta iyadoo la adeegsanayo emapper (v.2.0.1) 67 oo ku saleysan eggNOG (v.5.0)68.Xogta KEGG (la daabacay Feebarwari 10, 2020) 69. Talaabadii u dambaysay waxa la sameeyay iyada oo la is waafajiyay borotiinada iyo kaydka KEGG iyada oo la adeegsanayo DIAMOND (v.0.9.30)70 oo wadata su'aal iyo mawduuc daboolaya ≥70%.Natiijooyinka si dheeraad ah ayaa loo sifeeyay iyadoo loo eegayo NCBI Prokaryotic Genome Annotation Pipeline71 oo ku salaysan bitrate ≥ 50% ee ugu badnaan bitrate la filayo (isku xidhka laftiisa).Taxanayaasha hidda-wadaha ayaa sidoo kale loo adeegsaday soo-gelinta si loo aqoonsado BGC-yada genome-ka iyadoo la adeegsanayo antiSMASH (v.5.1.0)72 oo leh cabbirro caadi ah iyo qaraxyo kooxeedyo kala duwan.Dhammaan genome-yada iyo sharraxaadaha waxa lagu soo ururiyey OMD oo ay la socdaan xog-ururinta macnaha guud ee laga heli karo shabakadda (https://microbiomics.io/ocean/).
Si la mid ah hababka hore loo sharraxay12,22 waxaan u isticmaalnay CD-HIT (v.4.8.1) si loo ururiyo> 56.6 milyan oo hiddo-wadaha borotiinka-coding-ka ee bakteeriyada iyo hiddo-wadaha qadiimiga ah ee OMD ee 95% aqoonsiga iyo hiddo-wadaha gaaban (90% caymiska)73 ilaa > 17.7 milyan oo kooxo hidde-sideyaal ah.Taxanaha ugu dheer ayaa loo doortay inuu noqdo hiddasidaha matale koox kasta oo hiddo-wade.1038 metagenome-yada ayaa markaa la jaanqaaday> 17.7 milyan BWA (-a) xubnaha kutlada iyo faylalka BAM ee ka soo baxay ayaa la shaandheeyay si loo ilaaliyo kaliya la jaanqaadyada ≥95% aqoonsiga boqolkiiba iyo ≥45 isku dhejinta saldhigga.Dhererka-caadiga ah badnaanta hiddo-wadaha waxaa lagu xisaabiyay markii ugu horreysay ee la tiriyo gelinta isku-habboonaanta ugu wanaagsan, ka dibna, dhejisyada khariidad-fudud leh, lagu daray tiro jajab ah hiddo-wadaha bartilmaameedka ah ee u dhigma tirada gelinta gaarka ah.
Genomy-yada OMD ee la balaariyay (oo leh MAGs dheeraad ah oo ka socda "Ca. Eudormicrobiaceae", hoos eeg) ayaa lagu daray mOTUs74 xogta qalabka falanqaynta metagenomic (v.2.5.1) si loo abuuro kaydka tixraaca mOTU ee la fidiyay.Kaliya lix genomes-koobi ah (23,528 genomes) ayaa ka badbaaday tobankii uscMGs.Balaadhinta xogta waxa ay keentay 4,494 kooxood oo dheeraad ah oo heerka noocyada ah.1038 metagenomes ayaa la falanqeeyay iyadoo la adeegsanayo cabbirada mOTU ee caadiga ah (v.2).Wadar dhan 989 genomy oo ka kooban 644 kooxod mOTU ah (95% REF, 5% SAG iyo 99.9% oo ay iska leeyihiin MarDB) laguma arag astaanta mOTU.Tani waxay ka tarjumaysaa ilo dheeraad ah oo dheeraad ah oo go'doomin badeed ah genomes-ka MarDB (inta badan genome-yada aan la ogaan waxay la xiriiraan noolaha ka go'doonsan sediments, martigeliyaha badda, iwm.).Si aan u sii wadno diiradda saarista jawiga badweynta furan ee daraasaddan, waxaan ka saarnay iyaga falanqaynta hoose ilaa aan la ogaanin ama lagu darin kaydinta xogta mOTU ee fidsan ee lagu abuuray daraasaddan.
Dhammaan BGC-yada MAG, SAG iyo REF ee OMD (eeg korka) ayaa lagu daray BGC-yada lagu aqoonsaday dhammaan qaybaha metagenomic (antiSMASH v.5.0, xuduudaha caadiga ah) oo lagu gartaa isticmaalka BiG-SLICE (v.1.1) (PFAM domain) 75.Iyada oo ku saleysan sifooyinkan, waxaan xisaabinay dhammaan masaafada u dhexeysa BGC-yada waxaanan u kala qaybinay (xidhiidhyada celceliska) GCF iyo GCC annaga oo adeegsanayna marinnada fogaanta ee 0.2 iyo 0.8 siday u kala horreeyaan.Heerarkani waa laqabsiga marinada hore loo isticmaali jiray iyadoo la isticmaalayo fogaanta Euclidean75 oo ay weheliso masaafada cosine, taas oo yaraynaysa qaar ka mid ah khaladaadka istaraatiijiyada ururinta BiG-SLICE ee asalka ah (Xogta Dheeraadka ah).
BGC-yada ayaa markaa la sifeeyay si ay u sii hayaan ≥5 kb oo keliya oo lagu dhejiyay isgoysyada si loo yareeyo khatarta kala qaybsanaanta sidii hore loogu sharraxay16 iyo in laga saaro MarDB REFs iyo SAG-yada aan laga helin 1038 metagenomes (eeg kor).Tani waxay keentay in wadar dhan 39,055 BGCs ay ku xidhmaan genome-ga OMD, oo ay weheliso 14,106 dheeraad ah oo lagu aqoonsaday jajabyada metagenomic (ie aan lagu darin MAGs).Kuwan “metagenomic” BGC-yada waxa loo isticmaalay in lagu qiyaaso saamiga ka iman kara microbiome biosynthesis ee aan lagu qaban kaydka xogta (Xogta Dheeraadka ah).BGC kasta waxa lagu sifeeyey si waafaqsan noocyada wax soo saarka ee saadaalinta ah ee lagu qeexay anti-SMASH ama qaybaha badeecada qalafsan ee lagu qeexay BiG-SCAPE76.Si looga hortago shaybaaraynta eexda xagga tirooyinka (taxonomic iyo ka kooban shaqada ee GCC/GCF, fogaanta GCF iyo GCC si loo tixraaco xog-ururinta, iyo badnaanta metagenomic ee GCF), iyadoo la ilaalinayo kaliya BGC ugu dheer ee GCF nooc kasta, 39,055 BGCs ayaa la sii kala saaray. taasoo keentay wadar ahaan 17,689 BGC.
Cusbinimada GCC iyo GCF ayaa la qiimeeyay iyadoo lagu salaynayo masaafada u dhaxaysa xogta la xisaabiyay (RefSeq database in BiG-FAM)29 iyo tijaabo ahaan loo xaqiijiyay (MIBIG 2.0)30 BGC.Mid kasta oo ka mid ah 17,689 wakiilada BGCs, waxaanu dooranay masaafada ugu yar ee kaydka xogta xogta.Masaafadan ugu yar ayaa markaa la isku celceliyaa (celcelis ahaan) iyadoo loo eegayo GCF ama GCC, sida ku habboon.GCF waxaa loo arkaa mid cusub haddii masaafada u jirta xog ururinta ay ka weyn tahay 0.2, taasoo u dhiganta kala soocida ugu habboon ee u dhexeeya (celcelis ahaan) GCF iyo tixraaca.GCC, waxaanu dooranaa 0.4, kaas oo laba jeer ka ah marinka lagu qeexay GCF, si loo xidho xidhidh wakhti dheer ah.
Baaxadda metagenomic ee BGC waxaa lagu qiyaasay celceliska tirada badan ee hiddo-wadaha biosynthetic-ka (sida lagu go'aamiyay anti-SMASH) ee laga heli karo astaamaha heerka hiddo-wadaha.Baaxadda metagenomic ee GCF kasta ama GCC ayaa markaa loo xisaabiyay wadarta BGCs (oo ka baxsan 17,689).Khariidadahan tirada badan ayaa markii dambe caadi looga dhigay hal-abuurka gacanta iyadoo la adeegsanayo muunad kasta tirinta mOTU, taas oo sidoo kale xisaabinaysay dadaallada isku xigxiga (xog la fidiyay, Jaantuska 1d).Baahsanaanta GCF ama GCC waxaa loo xisaabiyay sida boqolleyda muunado badan> 0.
Fogaanta Euclidean ee u dhaxaysa shaybaarada waxaa laga soo xisaabiyay astaanta GCF ee caadiga ah.Masaafadan waxaa lagu dhimay cabbirka iyadoo la adeegsanayo UMAP77 iyo ka-soo-kabashada ka dhalatay waxa loo isticmaalay isku-ururinta cufnaanta aan la kormeerin iyadoo la isticmaalayo HDBSCAN78.Tirada ugu yar ee dhibcaha kooxda (iyo markaa tirada kooxaha) ee ay isticmaasho HDBSCAN waxaa lagu go'aamiyaa iyadoo la kordhinayo ixtimaalka isugeynta ee xubinnimada kooxda.Kutlooyinka la aqoonsaday (iyo muunado hoose oo dheellitiran oo random ah oo ka mid ah kooxahan si loogu xisaabtamo eexda falanqaynta kala duwanaanshiyaha kala duwanaanshiyaha (PERMANOVA)) ayaa lagu tijaabiyay muhiimada fogaanta Euclidean ee aan la dhimin iyadoo la isticmaalayo PERMANOVA.Celceliska cabbirka genome ee shaybaarrada waxa la xisaabiyay iyadoo lagu salaynayo tirada badan ee mOTU iyo qiyaasta qiyaasta genome ee xubnaha genome-yada.Gaar ahaan, celceliska cabbirka genome ee mOTU kasta waxaa lagu qiyaasay celceliska cabbirrada genome ee xubnaheeda oo la saxay dhammaystirka (shaandhaynta ka dib) Mb).loogu talagalay genomes dhexdhexaad ah oo leh daacadnimo ≥70%.Celceliska cabbirka genome-ka ee muunad kasta ayaa markaa loo xisaabiyay wadarta cabbirrada genome-ka mOTU oo lagu miisaamay badnaanta.
Qayb la sifeeyay oo ah BGC-yada genome-ka ee OMD ayaa lagu muujiyay geedaha GTDB bakteeriyada iyo qadiimiga ah (oo ku jira qaab-dhismeedka ≥5 kb, marka laga reebo REF iyo SAG MarDB oo aan laga helin 1038 metagenomes, eeg kor) iyo qaybaha badeecada la saadaaliyay ee ku saleysan phylogenetic booska genome (eeg kor).Waxaan marka hore yareynay xogta noocyada, anagoo adeegsanayna genome-ka leh BGC-yada ugu badan ee noocyadaas wakiil ahaan.Aragtida, wakiillada ayaa loo sii kala qaybiyay kooxo geedo ah, mar labaadna, qolo kasta oo unug leh, genome ka kooban tirada ugu badan ee BGCs ayaa loo doortay wakiil ahaan.Noocyada BGC-ku-kordhinta (ugu yaraan hal genome oo leh> 15 BGCs) ayaa si dheeraad ah loo falanqeeyay iyada oo la xisaabinayo Kala-duwanaanta Shannon ee noocyada badeecadaha ku qoran BGC-yadaas.Haddii dhammaan noocyada alaabada la saadaaliyay ay isku mid yihiin, isku-dhafka kiimikada iyo BGC-yada kale ee adag (sida ay saadaalisay anti-SMAH) ayaa loo tixgalinayaa inay ka tirsan yihiin nooc isku mid ah, iyada oo aan loo eegin sida ay u kala horreeyaan kooxda (tusaale borotiinka-bacteriocin iyo isku-dhafka bacteriocin-proteoprotein jirka).hybrid).
DNA haray (oo lagu qiyaasay inuu yahay 6 ng) laga soo bilaabo muunadda Malaspina MP1648, oo u dhiganta muunadda noolaha ee SAMN05421555 oo u dhiganta Illumina SRR3962772 akhriska metagenomic ee loo dejiyay akhrin gaaban, oo loo habeeyey sida waafaqsan nidaamka isku xigxiga ee PacBio oo leh gelinta ultra-hooseeya si loo isticmaalo muunad ultra-amp; xirmo (100-980-000) iyo SMRTbell Express 2.0 xirmada diyaarinta template (100-938-900).Si kooban, DNA-da soo hadhay waa la jaray, la hagaajiyay oo la nadiifiyay (ProNex beads) iyadoo la adeegsanayo Covaris (g-TUBE, 52104).DNA-da la nadiifiyey ayaa markaa la hoos geeyaa diyaarinta maktabadda, xoojinta, nadiifinta (ProNex beads) iyo xulashada cabbirka (> 6 kb, Blue Pippin) ka hor intaan la qaadin tallaabada ugu dambeysa ee nadiifinta (ProNex beads) iyo isku xigxiga ee madal Sequel II.
Dib u dhiska labadii hore ee ca.MAG Eremiobacterota, waxaan u aqoonsanay lix ANIs dheeraad ah> 99% (kuwa waxaa lagu daray Jaantuska 3), kuwaas oo markii hore lagu shaandheeyay iyadoo lagu salaynayo buundooyinka faddaraynta (kadibna loo aqoonsaday inay yihiin hiddo-wadeyaal, hoos eeg).Waxa kale oo aanu helnay saxaarad ay ku calaamadsan tahay "Ca".Eremiobacterota" oo laga soo qaatay daraasado kala duwan23 oo aan u isticmaalnay siddeed MAGs oo ka mid ah daraasaddayada si ay tixraac u noqoto akhrinta metagenomic ee laga soo bilaabo 633 eukaryotic enriched (> 0.8 µm) muunado iyadoo la adeegsanayo BWA (v.0.7.17) Ref -r1188, - calan) hoos u dhigista khariidad (5 milyan ayaa akhriyay).Iyada oo ku saleysan khariidado gaar ah oo kobcin (oo lagu sifeeyay 95% aqoonsiga toosinta iyo 80% daboolka akhrinta), 10 metagenomes ( caymis la filayo ≥5 ×) ayaa loo xushay isu imaatinka iyo 49 metagenomes dheeraad ah (caymiska la filayo ≥1 ×) ee isku xidhka nuxurka.Iyada oo la adeegsanayo cabbirro isku mid ah sida kor ku xusan, muunadahan waa la xidhay waxaana lagu daray 10 'Ca' oo dheeraad ah.MAG Eremiobacterota waa la soo celiyay.16-ka MAGs (aan la tirinin labada horeba ugu jiray kaydka xogta) waxay keenayaan tirada guud ee genome-yada OMD ee la balaariyay ilaa 34,815.MAGs waxa loo qoondeeyay darajooyin cashuureed iyadoo lagu salaynayo isu ekaanshaha genomiga iyo booska GTDB.18 MAGs ayaa laga saaray iyadoo la isticmaalayo dRep oo loo qaybiyay 5 nooc (ANI aan gaar ahayn> 99%) iyo 3 genera ( ANI intrageneric 85% ilaa 94%) isla qoyska dhexdiisa79.Wakiilada noocyada ayaa si gacanta lagu doortay iyadoo lagu salaynayo daacadnimo, faddarayn, iyo N50.Magacaabis la soo jeediyay ayaa lagu bixiyay Macluumaadka Dheeraadka ah.
Qiimee daacadnimada iyo faddaraynta 'Ca.MAG Eremiobacterota, waxaanu qiimaynay joogitaanka uscMG, iyo sidoo kale nasabka-iyo qaybaha hiddo-wadaha hal koobiga gaarka ah ee ay isticmaalaan CheckM iyo Anvi'o.Aqoonsiga 2 nuqul oo ka mid ah 40 uscMGs ayaa lagu xaqiijiyay dib u dhiska phylogenetic (hoos eeg) si meesha looga saaro wax kasta oo faddarayn kara (tani waxay u dhigantaa 5% oo ku salaysan 40 hidde-sideyaashan).Daraasad dheeri ah oo lagu sameeyay shan wakiil MAGs 'Ca.Heerka hoose ee wasakhaysan ee genomes-kan dib loo dhisay ayaa loo xaqiijiyay noocyada Eremiobacterota iyadoo la adeegsanayo isdhexgalka Anvi'o oo ku salaysan isku xidhka tirada iyo isku xigxiga (Xogta Dheeraadka ah)59.
Falanqaynta phylogenomic, waxaan dooranay shan wakiil MAGs "Ca".Eudormicrobiaceae, dhammaan noocyada "Ca.Genome-ka Eremiobacterota iyo xubnaha phyla kale (oo ay ku jiraan UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria iyo Planctomycetota) ayaa laga heli karaa GTDB (r89)13.Dhammaan genome-yadan waxaa loo sharraxay sidii hore loogu sharraxay soo saarista hidda-wadaha calaamadeeyaha koobiga iyo sharraxaadda BGC.Genomy-yada GTDB waxa loo dhawray si waafaqsan hufnaanta sare iyo shuruudaha wasakhda.Falanqaynta phylogenetic waxaa lagu sameeyay iyadoo la adeegsanayo socodka shaqada Anvi'o Phylogenetics59.Geedka waxaa lagu dhisay iyadoo la isticmaalayo IQTREE (v.2.0.3) (doorashada hore iyo -bb 1000)80 oo ku saabsan alignment of 39 tandem borotiinada ribosomal oo lagu aqoonsaday Anvi'o (MUSCLE, v.3.8.1551)81.Jagooyinkiisii ​​waa la dhimay.si loo daboolo ugu yaraan 50% genome82 iyo Planctomycecota ayaa loo isticmaalay sidii koox ka baxsan oo ku salaysan GTDB geedka topology.Hal geed oo ka mid ah 40 uscMGs ayaa la dhisay iyadoo la adeegsanayo qalab iyo cabbirro isku mid ah.
Waxaan u isticmaalnay Traitar (v.1.1.2) oo leh cabbirada caadiga ah (phenotype, from nucleotides)83 si loo saadaaliyo sifooyinka microbial caadiga ah.Waxaan sahaminay hab-nololeedka ugaarsiga ee suurtagalka ah iyadoo lagu salaynayo index84 horay loo sameeyay oo ugaarsada taasoo ku xiran nuxurka hiddasidaha codeeynta borotiinka ee genome-ka.Gaar ahaan, waxaan u isticmaalnaa DIAMOND si aan u barbar dhigno borotiinnada genome-ga ka dhanka ah xogta OrthoMCL (v.4)85 annagoo adeegsanayna xulashooyinka-ka-sii-dheeraada-id 25-su'aal-dabooli 70-mawduuc-cover 70-top 20 IYO tiriso hiddo-wadaha u dhigma hiddo-wadaha calaamadaynta ugaadhsadayaasha iyo kuwa aan ugaadhsanayn.Tusmadu waa farqiga u dhexeeya tirada calaamadaha ugaadhsiga iyo kuwa aan ugaadhsiga ahayn.Sida xakameyn dheeraad ah, waxaan sidoo kale falanqeynay genome "Ca".Qodobka Entotheonella TSY118 wuxuu ku salaysan yahay xiriirka ay la leedahay Ca.Eudoremicrobium (xajmiga genome weyn iyo kartida biosynthetic).Marka xigta, waxaanu tijaabinay isku xirka suurtagalka ah ee ka dhexeeya hidde-sideyaasha ugaadhsada iyo kuwa aan ugaadhsade ahayn iyo awoodda biosynthetic ee Ca.Eudormicrobiaceae” oo la ogaaday in aan ka badnayn hal hidde-side (laga bilaabo nooc kasta oo hidde-sidayaasha calaamadeeyaha ah, ie, ugaarsada/noolaha aan ugaadhsade ahayn) ay ku dul-baxaan BGC, taasoo soo jeedinaysa in BGC aanay isku khaldin calaamadaha ugaadhsiga.Sharaxaad dheeri ah oo genomic ah oo ku saabsan replions la xoqay ayaa la sameeyay iyadoo la adeegsanayo TXSSCAN (v.1.0.2) si gaar ah loo baadho nidaamka sirta, pili, iyo flagella86.
Shan wakiil 'Ca's ayaa lagu sameeyay khariidadeynta 623 metatranscriptomes oo laga soo qaatay jajabyada kobcinta prokaryotic iyo eukaryotic ee badaha Tara22,40,87 (iyadoo la adeegsanayo BWA, v.0.7.17-r1188, -calan).Eudormicrobiaceae genome.Faylasha BAM waxaa lagu farsameeyay FeatureCounts (v.2.0.1)88 kadib 80% la akhriyay daboolida iyo 95% shaandhaynta aqoonsiga tirada gelis halkii hidde.Khariidadaha la soo saaray ayaa caadi looga dhigay dhererka hiddo-wadaha iyo hidde-sidaha tirada badan ee mOTU (tirada gelinta celceliska dhererka-caadiga ah ee tirooyinka galinta>0) iyo log-loo beddelay 22.74 si loo helo muujinta qaraabada halkii unug ee heer kasta oo hiddo-wade, taas oo sidoo kale sharraxaysa kala duwanaanshiyaha laga bilaabo muunada ilaa muunada inta lagu guda jiro isku xigxiga.Saamiyada noocan oo kale ah waxay u oggolaanayaan falanqaynta isbarbardhigga, yaraynta dhibaatooyinka halabuurka marka la isticmaalayo xogta tirada badan.Kaliya muunado leh> 5 oo ka mid ah 10 mOTU hiddo-wadaha calaamadeeyayaasha ayaa loo tixgeliyey falanqayn dheeraad ah si loogu oggolaado qayb weyn oo ku filan oo genome ah in la ogaado.
Muuqaalka qoraalka caadiga ah ee 'Ca.E. taraoceanii waxaa lagu sameeyay hoos u dhigista cabbirka iyadoo la isticmaalayo UMAP waxaana ka soo baxay matalaada loo isticmaalay koox aan la ilaalin iyadoo la isticmaalayo HDBSCAN (eeg kor) si loo go'aamiyo heerka hadalka.PERMANOVA waxay tijaabisaa muhiimada kala duwanaanshaha udhaxeeya rucubyada la aqoonsaday ee meesha fogaanta asalka ah (aan la dhimin).Tilmaamaha kala duwan ee u dhexeeya xaaladahan ayaa lagu tijaabiyay guud ahaan genome (eeg kor) iyo 201 KEGG waddooyinka ayaa lagu aqoonsaday 6 kooxood oo shaqeynaya, kuwaas oo kala ah: BGC, nidaamka qarsoodiga ah iyo hiddo-wadaha calanka ee TXSSCAN, enzymes deradation (protease iyo peptidases), iyo ugaadhsiga iyo kuwa aan- hiddo-raaca ugaadhsiga.calaamadaha ugaadhsiga.Muunad kasta, waxaanu xisaabinay celceliska dhexdhexaadka ah ee fasalka kasta (xusuusnow in muujinta BGC lafteeda loo xisaabiyo inay tahay muujinta dhexdhexaadka ah ee hiddo-wadaha biosynthetic ee BGC) waxaana lagu tijaabiyay muhiimada gobolada oo dhan (tijaabada Kruskal-Wallis ee loogu talagalay FDR).
Hiddo-sidaha synthetic ayaa laga soo iibsaday GenScript iyo aasaasayaasha PCR waxaa laga soo iibsaday Microsynth.Phusion polymerase oo ka socda Thermo Fisher Scientific ayaa loo isticmaalay xoojinta DNA-ga.NucleoSpin plasmids, NucleoSpin jel iyo xirmada sifaynta PCR ee Macherey-Nagel ayaa loo isticmaalay sifaynta DNA.Enzymes xaddidan iyo ligase T4 DNA ayaa laga soo iibsaday New England Biolabs.Kiimikooyinka aan ka ahayn isopropyl-β-d-1-thiogalactopyranoside (IPTG) (Biosynth) iyo 1,4-dithiothreitol (DTT, AppliChem) ayaa laga soo iibsaday Sigma-Aldrich waxaana la isticmaalay iyada oo aan la nadiifin.Antibiyootikada chloramphenicol (Cm), spectinomycin dihydrochloride (Sm), ampicillin (Amp), gentamicin (Gt), iyo carbenicillin (Cbn) ayaa laga soo iibsaday AppliChem.Bacto Tryptone iyo Bacto Yeast Soosaarida qaybaha warbaahinta ayaa laga soo iibsaday BD Biosciences.Trypsin ee isku xigxiga waxaa laga soo iibsaday Promega.
Taxanayaasha hidda-wadaha ayaa laga soo saaray anti-SMASH ee la saadaaliyay BGC 75.1.E. malaspinii (xog dheeri ah).
Hidde-sidayaasha embA (locus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (locus, MALA_SAMN05422137_METAG-framework_127-gene_4), iyo embAM (oo ay ku jiraan cod-dhismeedyo isku dhafan) E Goorma.Hidde-sidaha embA waxa la hoos dhigay goobta ugu horraysa ee cloning (MCS1) ee pACYCDuet-1(CmR) iyo pCDFDuet-1(SmR) oo leh BamHI iyo HindIII goobaha kala goynta.EmbM iyo hiddo-wadaha embMopt (codon-optimized) ayaa la hoos geliyay MCS1 pCDFDuet-1 (SmR) oo ay la socdaan BamHI iyo HindIII waxaana la dhigay goobta labaad ee cloning ee pCDFDuet-1 (SmR) iyo pRSFDuet-1 (KanR) (MCS2) oo leh NdeI/ChoI.Cajaladda embAM waxa lagu hoos xidhay pCDFDuet1(SmR) oo leh BamHI iyo HindIII goobaha jeexjeexa.Hidde-sidaha orf3/embI (locus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) waxaa lagu dhisay isku-kordhinta PCR iyadoo la adeegsanayo qalabyada EmbI_OE_F_NdeI iyo EmbI_OE_R_XhoI, la dheefshiiday NdeI/Xhoet-1 pMc enzymes (Kaabayaasha miis).6).Xannibaadda dheefshiidka ensaymka iyo ligation-ka ayaa la sameeyay iyadoo la raacayo borotokoolka soo saaraha (New England Biolabs).

 


Waqtiga boostada: Mar-14-2023