1.一种萘安莎类抗生素曲张链丝菌素的生物合成基因簇,其特征在于,所述的基因簇的核苷酸序列为SEQ ID NO: 1中第1-95304位所示;基因簇所包括的编码曲张链丝菌素生物合成相关基因具体为:
负责曲张链丝菌素生物合成的前体3-氨基-5-羟基苯甲酸的生物合成基因,即stvG,stvH,stvI,stvJ,stvK,stvL,stvM,stvN共8个基因:
stvG位于SEQ ID NO: 1中第76251-77324位碱基处,长度为1074个碱基对,编码3-DHQ合酶,长度为357个氨基酸,氨基酸序列为SEQ ID NO.2;
stvH位于SEQ ID NO: 1中第77495-78649位碱基处,长度为1155个碱基对,编码DAHP合酶,长度为384个氨基酸,氨基酸序列为SEQ ID NO.3;
stvI位于SEQ ID NO: 1中第78657-79469位碱基处,长度为813个碱基对,编码莽草酸脱氢酶,长度为270个氨基酸,氨基酸序列为SEQ ID NO.4;
stvK位于SEQ ID NO: 1中第79685-80845位碱基处,长度为1161个碱基对,编码AHBA合酶,长度为386个氨基酸,氨基酸序列为SEQ ID NO.5;
stvL位于SEQ ID NO: 1中第81127-81942位碱基处,长度为816个碱基对,编码氧化还原酶,长度为271个氨基酸,氨基酸序列为SEQ ID NO.6;
stvM位于SEQ ID NO: 1中第82095-82679位碱基处,长度为585个碱基对,编码磷酸乙醇酸磷酸酶,长度为194个氨基酸,氨基酸序列为SEQ ID NO.7;
stvN位于SEQ ID NO: 1中第82699-83652位碱基处,长度为954个碱基对,编码葡糖激酶,长度为317个氨基酸,氨基酸序列为SEQ ID NO.8;
stvJ位于SEQ ID NO: 1中第94975-94424位碱基处,长度为552个碱基对,编码脱水酶,长度为183个氨基酸,氨基酸序列为SEQ ID NO.9;
负责曲张链丝菌素碳骨架延伸的基因,即stvA,stvB,stvC,stvD,stvE共5个基因:
stvA位于SEQ ID NO: 1中第20415-37088位碱基处,长度为16674个碱基对,编码聚酮合酶,长度为5557个氨基酸,氨基酸序列为SEQ ID NO.10;
stvB位于SEQ ID NO: 1中第37120-47883位碱基处,长度为10764个碱基对,编码聚酮合酶,长度为3587个氨基酸,氨基酸序列为SEQ ID NO.11;
stvC位于SEQ ID NO: 1中第48086-58798位碱基处,长度为10713个碱基对,编码聚酮合酶,长度为3570个氨基酸,氨基酸序列为SEQ ID NO.12;
stvD位于SEQ ID NO: 1中第58958-64522位碱基处,长度为5565个碱基对,编码聚酮合酶,长度为1854个氨基酸,氨基酸序列为SEQ ID NO.13;
stvE位于SEQ ID NO: 1中第64592-75304位碱基处,长度为10713个碱基对,编码聚酮合酶,长度为3570个氨基酸,氨基酸序列为SEQ ID NO.14;
负责曲张链丝菌素生物合成中后修饰相关的基因stvA1,orf1309,orf1308,orf1307,orf1306,orf1305,orf1304,orf1303,orf1302,orf1301,stvO1,stvO2,stvO3,stvP1,stvM1,stvP2,stvA2,stvP3,stvF,stvP4,stvO4,stvP5,stvM2,stvM3,orf1272,stvR1,orf1270,stvR2共28个基因:
stvA1位于SEQ ID NO: 1中第348-707位碱基处,长度为360个碱基对,编码酰基转移酶,长度为119个氨基酸,氨基酸序列为SEQ ID NO.15;
orf1309位于SEQ ID NO: 1中第740-1354位碱基处,长度为615个碱基对,编码芳香基硫酸酯酶,长度为204个氨基酸,氨基酸序列为SEQ ID NO.16;
orf1308位于SEQ ID NO: 1中第1380-1703位碱基处,长度为324个碱基对,编码未知蛋白,长度为107个氨基酸,氨基酸序列为SEQ ID NO.17;
orf1307位于SEQ ID NO: 1中第3161-1722位碱基处,长度为1440个碱基对,编码6-磷酸葡糖酸脱氢酶,长度为479个氨基酸,氨基酸序列为SEQ ID NO.18;
orf1306位于SEQ ID NO: 1中第3335-4306位碱基处,长度为972个碱基对,编码乙酰木聚糖酯酶,长度为323个氨基酸,氨基酸序列为SEQ ID NO.19;
orf1305位于SEQ ID NO: 1中第4428-5765位碱基处,长度为1338个碱基对,编码肽酶,长度为445个氨基酸,氨基酸序列为SEQ ID NO.20;
orf1304位于SEQ ID NO: 1中第7074-5854位碱基处,长度为1221个碱基对,编码膜蛋白,长度为406个氨基酸,氨基酸序列为SEQ ID NO.21;
orf1303位于SEQ ID NO: 1中第7347-8063位碱基处,长度为717个碱基对,编码三价铁还原酶,长度为238个氨基酸,氨基酸序列为SEQ ID NO.22;
orf1302位于SEQ ID NO: 1中第8239-9288位碱基处,长度为1050个碱基对,编码糖基转移酶,长度为349个氨基酸,氨基酸序列为SEQ ID NO.23;
orf1301位于SEQ ID NO: 1中第9379-10599位碱基处,长度为1221个碱基对,编码葡糖-1-磷酸腺苷酰基转移酶,长度为406个氨基酸,氨基酸序列为SEQ ID NO.24;
stvO1位于SEQ ID NO: 1中第10846-11814位碱基处,长度为969个碱基对,编码NADP依赖的脱氢酶,长度为322个氨基酸,氨基酸序列为SEQ ID NO.25;
stvO2位于SEQ ID NO: 1中第11823-12806位碱基处,长度为984个碱基对,编码氧化还原酶,长度为327个氨基酸,氨基酸序列为SEQ ID NO.26;
stvO3位于SEQ ID NO: 1中第12889-13452位碱基处,长度为564个碱基对,编码NADPH依赖的还原酶,长度为187个氨基酸,氨基酸序列为SEQ ID NO.27;
stvP1位于SEQ ID NO: 1中第13481-14773位碱基处,长度为1293个碱基对,编码细胞色素P450,长度为430个氨基酸,氨基酸序列为SEQ ID NO.28;
stvM1位于SEQ ID NO: 1中第15159-15767位碱基处,长度为609个碱基对,编码甲基转移酶,长度为202个氨基酸,氨基酸序列为SEQ ID NO.29;
stvP2位于SEQ ID NO: 1中第15800-17005位碱基处,长度为1206个碱基对,编码细胞色素P450,长度为401个氨基酸,氨基酸序列为SEQ ID NO.30;
stvA2位于SEQ ID NO: 1中第18275-17106位碱基处,长度为1170个碱基对,编码脂肪酰转移酶,长度为389个氨基酸,氨基酸序列为SEQ ID NO.31;
stvP3位于SEQ ID NO: 1中第18765-19958位碱基处,长度为1194个碱基对,编码细胞色素P450,长度为397个氨基酸,氨基酸序列为SEQ ID NO.32;
stvF位于SEQ ID NO: 1中第75408-76202位碱基处,长度为795个碱基对,编码酰胺合酶,长度为264个氨基酸,氨基酸序列为SEQ ID NO.33;
stvP4位于SEQ ID NO: 1中第83977-85221位碱基处,长度为1245个碱基对,编码细胞色素P450,长度为414个氨基酸,氨基酸序列为SEQ ID NO.34;
stvO4位于SEQ ID NO: 1中第86934-85273位碱基处,长度为1662个碱基对,编码丙酸羟化酶,长度为553个氨基酸,氨基酸序列为SEQ ID NO.35;
stvP5位于SEQ ID NO: 1中第87228-88481位碱基处,长度为1254个碱基对,编码细胞色素P450,长度为417个氨基酸,氨基酸序列为SEQ ID NO.36;
stvM2位于SEQ ID NO: 1中第89660-88593位碱基处,长度为1068个碱基对,编码甲基转移酶,长度为355个氨基酸,氨基酸序列为SEQ ID NO.37;
stvM3位于SEQ ID NO: 1中第90540-89737位碱基处,长度为804个碱基对,编码甲基转移酶,长度为267个氨基酸,氨基酸序列为SEQ ID NO.38;
orf1272位于SEQ ID NO: 1中第90982-90785位碱基处,长度为198个碱基对,编码氧铁还原酶,长度为65个氨基酸,氨基酸序列为SEQ ID NO.39;
stvR1位于SEQ ID NO: 1中第92612-91314位碱基处,长度为1299个碱基对,编码调控因子,长度为432个氨基酸,氨基酸序列为SEQ ID NO.40;
orf1270位于SEQ ID NO: 1中第92941-93300位碱基处,长度为360个碱基对,编码未知蛋白,长度为119个氨基酸,氨基酸序列为SEQ ID NO.41;
stvR2位于SEQ ID NO: 1中第93785-94414位碱基处,长度为630个碱基对,编码调控因子,长度为209个氨基酸,氨基酸序列为SEQ ID NO.42。