細(xì)胞工廠設(shè)計(jì)數(shù)字化賦能綠色生物制造
中國(guó)網(wǎng)/中國(guó)發(fā)展門戶網(wǎng)訊 綠色制造是綜合考慮環(huán)境影響和資源效益的現(xiàn)代化制造模式,而綠色生物制造作為綠色制造重要的方式之一,具有得天獨(dú)厚的優(yōu)勢(shì)。綠色生物制造以生物細(xì)胞及其酶的反應(yīng)過程為核心,以CO2、木質(zhì)纖維素、農(nóng)作物廢棄物、其他可再生生物基碳源等為原料,生產(chǎn)燃料、藥物分子、材料、大宗化學(xué)品和食品等低碳、可持續(xù)發(fā)展產(chǎn)品,實(shí)現(xiàn)原料獲取、過程制造的綠色化和低碳化。綠色生物制造可以實(shí)現(xiàn)資源的高效利用和環(huán)境的可持續(xù)發(fā)展,是國(guó)家提出大力發(fā)展的新質(zhì)生產(chǎn)力的重要組成部分。綠色生物制造以高科技、高性能、高質(zhì)量等為特征,完美契合新質(zhì)生產(chǎn)力,是符合新發(fā)展理念的先進(jìn)生產(chǎn)力質(zhì)態(tài)。

高性能細(xì)胞工廠作為綠色生物制造的核心,是工業(yè)發(fā)酵過程的主體。為響應(yīng)快速發(fā)展新質(zhì)生產(chǎn)力的號(hào)召,細(xì)胞工廠需要快速更新迭代以適應(yīng)不同的生產(chǎn)環(huán)境,以及追求更高的生產(chǎn)性能,這對(duì)細(xì)胞工廠的精準(zhǔn)設(shè)計(jì)、快速迭代、發(fā)酵過程控制等提出了極高的要求。而隨著計(jì)算領(lǐng)域的發(fā)展,“數(shù)字孿生”(digital twin)實(shí)現(xiàn)了對(duì)化工過程優(yōu)化與控制、新產(chǎn)品開發(fā)與測(cè)試等的數(shù)字化,人工智能更拓展并提高了數(shù)字孿生的應(yīng)用范圍和效果?;陬愃频南敕?,對(duì)細(xì)胞內(nèi)復(fù)雜的生物過程進(jìn)行數(shù)字化模型構(gòu)建,構(gòu)建多種數(shù)據(jù)庫(kù),并利用機(jī)器學(xué)習(xí)等手段對(duì)酶、細(xì)胞工廠代謝網(wǎng)絡(luò)、發(fā)酵工藝等進(jìn)行數(shù)字化,形成細(xì)胞工廠全生命周期數(shù)字化設(shè)計(jì)方法(圖1)。利用這些方法,可以快速、高效獲得高性能細(xì)胞工廠,賦能綠色生物制造。
細(xì)胞工廠數(shù)字化基礎(chǔ):代謝數(shù)據(jù)庫(kù)、酶數(shù)據(jù)庫(kù)
數(shù)據(jù)是數(shù)字化的基礎(chǔ)。在細(xì)胞工廠中,由酶催化的代謝反應(yīng)是實(shí)現(xiàn)細(xì)胞生長(zhǎng)、產(chǎn)物合成的關(guān)鍵。代謝數(shù)據(jù)庫(kù)包含代謝化合物、生化反應(yīng)、催化生化反應(yīng)的酶、代謝反應(yīng)組合形成的代謝途徑等信息,是代謝網(wǎng)絡(luò)數(shù)字化的基礎(chǔ)。
代謝數(shù)據(jù)庫(kù)、酶數(shù)據(jù)庫(kù)的發(fā)展現(xiàn)狀
近年來,隨著互聯(lián)網(wǎng)時(shí)代的來臨,酶、代謝數(shù)據(jù)的共享為研究人員帶來了極大的便利(表1)。KEGG、MetaCyc(BioCyc數(shù)據(jù)庫(kù)子數(shù)據(jù)庫(kù))等常用的綜合代謝數(shù)據(jù)庫(kù)在分子水平建立了對(duì)細(xì)胞代謝的系統(tǒng)認(rèn)知,Brenda、PDB、Uniprot等酶反應(yīng)數(shù)據(jù)庫(kù)則聚焦代謝反應(yīng)酶的結(jié)構(gòu)與功能。代謝數(shù)據(jù)庫(kù)和酶數(shù)據(jù)庫(kù)的結(jié)合,將由代謝途徑組成的代謝網(wǎng)絡(luò),與酶結(jié)構(gòu)功能、催化活性、細(xì)胞定位等的酶催化數(shù)據(jù)相結(jié)合,形成對(duì)細(xì)胞工廠代謝的系統(tǒng)性表征。同時(shí),隨著研究的深入,HMDB(人類代謝組數(shù)據(jù)庫(kù))、SGD(酵母基因組數(shù)據(jù)庫(kù))、GMD(植物代謝組數(shù)據(jù)庫(kù))等物種專有代謝數(shù)據(jù)庫(kù)、基因數(shù)據(jù)庫(kù),在特定的應(yīng)用環(huán)境中也發(fā)揮了重要作用。

我國(guó)在發(fā)展和建設(shè)自主知識(shí)產(chǎn)權(quán)的高質(zhì)量代謝、酶數(shù)據(jù)庫(kù)方面發(fā)展較晚,導(dǎo)致我國(guó)在綠色生物制造產(chǎn)業(yè)發(fā)展安全及在國(guó)際上的核心競(jìng)爭(zhēng)力存在一定程度的隱患。為此,近年來國(guó)家和研究人員開始重視生物科學(xué)數(shù)據(jù)的標(biāo)準(zhǔn)化及安全管理,頒布了《中華人民共和國(guó)生物安全法》,同時(shí)依托《中華人民共和國(guó)數(shù)據(jù)安全法》等法律法規(guī),推進(jìn)生物科學(xué)數(shù)據(jù)的標(biāo)準(zhǔn)化數(shù)據(jù)庫(kù)構(gòu)建與規(guī)范化管理。
基于大語言模型的數(shù)據(jù)庫(kù)更新方法
隨著合成生物技術(shù)的發(fā)展,細(xì)胞中新酶、代謝反應(yīng)的更新速度呈指數(shù)級(jí)增長(zhǎng),傳統(tǒng)數(shù)據(jù)庫(kù)更新及維護(hù)需要人工對(duì)信息進(jìn)行整理,存在一定滯后性。隨著計(jì)算機(jī)技術(shù)的發(fā)展,通過機(jī)器學(xué)習(xí)挖掘文獻(xiàn)中文本提取代謝相關(guān)信息成為可能,而近幾年GPT-4、Bard等大語言模型(LLM)在生物醫(yī)藥領(lǐng)域的發(fā)展與應(yīng)用,更是提高了生物代謝信息提取的速度與準(zhǔn)確性。而在部分文獻(xiàn)中,代謝途徑信息以圖片格式展示,為提取這部分不在文本中的代謝數(shù)據(jù)信息,在最新的報(bào)道中,研究人員使用包括Faster R-CNN和PaddleOCR的機(jī)器學(xué)習(xí)模型對(duì)文獻(xiàn)中包含代謝途徑的圖片進(jìn)行識(shí)別,實(shí)現(xiàn)了高通量、全面地從文獻(xiàn)中提取代謝反應(yīng)信息。隨著機(jī)器讀文獻(xiàn)中信息獲取能力和準(zhǔn)確性的提升,代謝數(shù)據(jù)庫(kù)、酶數(shù)據(jù)庫(kù)的數(shù)據(jù)更新將更具時(shí)效性。
細(xì)胞工廠酶的數(shù)字化設(shè)計(jì)
酶是細(xì)胞中代謝反應(yīng)的核心,酶的功能、活性、選擇性直接影響細(xì)胞工廠的產(chǎn)物合成能力。酶的數(shù)字化設(shè)計(jì)為細(xì)胞工廠中代謝反應(yīng)提供了高效的催化劑。通過數(shù)字化方法,預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)與功能,并進(jìn)行酶的改造設(shè)計(jì),可將酶的催化活性提高數(shù)百甚至上千倍。例如,通過理論計(jì)算-實(shí)驗(yàn)驗(yàn)證,ω-轉(zhuǎn)胺酶的kcat/Km值提高了1 660倍。
蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)
蛋白質(zhì)結(jié)構(gòu)是其功能的基礎(chǔ),數(shù)字化酶的設(shè)計(jì)依賴于蛋白質(zhì)結(jié)構(gòu)的精準(zhǔn)預(yù)測(cè)。根據(jù)不同的預(yù)測(cè)思路,研究人員開發(fā)了多種蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)軟件,包括基于同源建模的SWISS-MODEL、基于無模板方法的Rosetta等。而Google DeepMind團(tuán)隊(duì)基于深度學(xué)習(xí)算法開發(fā)的Alphafold在精準(zhǔn)預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的基礎(chǔ)上,更提高了蛋白質(zhì)、核酸、小分子、離子間互作結(jié)構(gòu)的預(yù)測(cè)準(zhǔn)確性,將生物大分子結(jié)構(gòu)預(yù)測(cè)推上了新高度。
細(xì)胞工廠酶的改造——酶的再設(shè)計(jì)
酶的再設(shè)計(jì)根據(jù)已有酶的結(jié)構(gòu)功能,對(duì)催化活性中心或其他關(guān)鍵位點(diǎn)氨基酸進(jìn)行突變,并通過量子力學(xué)模擬(QM)、分子動(dòng)力學(xué)模擬(MD)、粗粒化(CG)模擬、分子對(duì)接等計(jì)算生物化學(xué)手段進(jìn)行分析,并指導(dǎo)濕實(shí)驗(yàn)驗(yàn)證,實(shí)現(xiàn)以催化活性提高或耐受能力提高等為目標(biāo)的快速酶設(shè)計(jì)。
細(xì)胞工廠酶的創(chuàng)新——酶的從頭設(shè)計(jì)
蛋白質(zhì)結(jié)構(gòu)決定功能,而理論上蛋白質(zhì)的氨基酸序列決定蛋白質(zhì)結(jié)構(gòu),已知功能酶的量級(jí)遠(yuǎn)遠(yuǎn)小于由隨機(jī)氨基酸序列組成的“蛋白質(zhì)空間”。相比于酶的再設(shè)計(jì),酶的從頭設(shè)計(jì)旨在結(jié)合已有酶骨架結(jié)構(gòu)及功能特點(diǎn),拓展已知功能酶在蛋白質(zhì)空間中的范圍,實(shí)現(xiàn)新功能酶的設(shè)計(jì),探索浩瀚未知的蛋白質(zhì)空間。限于酶從頭設(shè)計(jì)的難度,現(xiàn)階段高性能軟件及成功案例相對(duì)較少,包括ORBIT、DESIGNER、Rosetta、CCBuilder、PRODA等在內(nèi)的多種軟件能夠?qū)崿F(xiàn)酶的從頭設(shè)計(jì)。其中Rosetta針對(duì)自然界中沒有酶可以催化的化學(xué)反應(yīng),如Kemp消除反應(yīng)、逆醛縮反應(yīng)等,進(jìn)行酶的從頭設(shè)計(jì),創(chuàng)造了可以催化這些反應(yīng)的人工設(shè)計(jì)酶,拓展了酶可催化反應(yīng)的種類,Rosetta的開發(fā)者David Baker也因在計(jì)算蛋白領(lǐng)域的貢獻(xiàn)獲得2024年諾貝爾化學(xué)獎(jiǎng)。
細(xì)胞工廠代謝網(wǎng)絡(luò)數(shù)字化設(shè)計(jì)
酶的數(shù)字化實(shí)現(xiàn)了酶催化代謝反應(yīng)的優(yōu)化及新功能酶的設(shè)計(jì),拓展了以酶催化反應(yīng)為核心的細(xì)胞工廠的功能。在細(xì)胞工廠的代謝層面,細(xì)胞內(nèi)源的酶促反應(yīng)會(huì)組成復(fù)雜的代謝網(wǎng)絡(luò),而通過合成生物學(xué)添加的外源路徑更增加了細(xì)胞工廠設(shè)計(jì)的難度。為實(shí)現(xiàn)目標(biāo)產(chǎn)物的高效合成,在細(xì)胞工廠中,需要對(duì)復(fù)雜代謝網(wǎng)絡(luò)中物質(zhì)流、能量流、異源合成路徑等進(jìn)行組織優(yōu)化,這通常需要耗費(fèi)大量的物力和時(shí)間成本。基因組尺度代謝網(wǎng)絡(luò)模型(GEM)、生物逆合成途徑預(yù)測(cè)、基因線路數(shù)字化設(shè)計(jì)等數(shù)字化方法可以指導(dǎo)細(xì)胞工廠的設(shè)計(jì),減少試錯(cuò)成本(圖2)。

基因組尺度代謝網(wǎng)絡(luò)模型(GEM)指導(dǎo)細(xì)胞工廠代謝網(wǎng)絡(luò)數(shù)字化設(shè)計(jì)
GEM將代謝網(wǎng)絡(luò)數(shù)字化,以描述生物體整個(gè)代謝途徑中基因—蛋白質(zhì)—代謝反應(yīng)的關(guān)系特征,是通過數(shù)學(xué)模型模擬細(xì)胞內(nèi)代謝反應(yīng)的系統(tǒng)生物學(xué)研究方法。自研究人員首次在流感嗜血桿菌中完成了GEM的構(gòu)建與應(yīng)用,在接下來的20余年中,為提高GEM計(jì)算的準(zhǔn)確性,在以代謝流矩陣為核心的代謝流平衡分析(FBA)基本算法的基礎(chǔ)上,添加了酶約束、熱力學(xué)約束及多約束等不同層次的附加約束,并結(jié)合轉(zhuǎn)錄組學(xué)、代謝組學(xué)等實(shí)驗(yàn)數(shù)據(jù),實(shí)現(xiàn)了多種生物高質(zhì)量GEM的構(gòu)建與應(yīng)用]。而隨著獲取實(shí)驗(yàn)數(shù)據(jù)成本降低、數(shù)據(jù)更新速度加快,GEM也在不斷地更新重構(gòu),以適應(yīng)不同的應(yīng)用環(huán)境。
GEM的模型構(gòu)建方法主要包括:手動(dòng)構(gòu)建、自動(dòng)構(gòu)建和半自動(dòng)構(gòu)建。2010年COBRA ToolBox工具箱的開發(fā)實(shí)現(xiàn)了GEM手動(dòng)構(gòu)建的數(shù)字化,但手動(dòng)構(gòu)建需要耗費(fèi)大量的時(shí)間。自動(dòng)與半自動(dòng)工具加快了GEM模型的構(gòu)建,自動(dòng)構(gòu)建GEM,如Model SEED等工具箱可以快速大批量生成多個(gè)物種的GEM,但數(shù)據(jù)質(zhì)量很大程度影響自動(dòng)構(gòu)建的GEM模型的精準(zhǔn)度。而半自動(dòng)構(gòu)建GEM的工具既可以快速收集數(shù)據(jù),又可以進(jìn)行手動(dòng)數(shù)據(jù)校正,保證了快速構(gòu)建的模型的精準(zhǔn)性,成為現(xiàn)階段GEM構(gòu)建與重構(gòu)的主要方法?,F(xiàn)階段半自動(dòng)構(gòu)建模型的方法逐漸成熟并趨于標(biāo)準(zhǔn)化,已有多種工具箱被開發(fā)使用:RAVEN工具可以重構(gòu)和分析GEM,并將結(jié)果進(jìn)行可視化;Merlin集成了序列匹配與亞細(xì)胞定位功能,使得其使用極為方便;GECKO工具通過動(dòng)力學(xué)和分子生物學(xué)數(shù)據(jù)向GEM中添加酶制約因素,從而提高GEM預(yù)測(cè)能力。
利用構(gòu)建的模型,通過FBA算法計(jì)算細(xì)胞內(nèi)代謝流量,預(yù)測(cè)細(xì)胞以最大化生長(zhǎng)或生產(chǎn)產(chǎn)物為目標(biāo)的代謝通量,進(jìn)而為理解細(xì)胞內(nèi)的代謝流量變化提供幫助;而MOMA、FSEOF及OptKnock等算法則以提高生長(zhǎng)與生產(chǎn)為目標(biāo),預(yù)測(cè)細(xì)胞代謝通量分布,并提供基因表達(dá)強(qiáng)度優(yōu)化策略,為細(xì)胞工廠實(shí)驗(yàn)設(shè)計(jì)提供指導(dǎo)。
隨著數(shù)據(jù)更新速度的加快及模型構(gòu)建技術(shù)的更新,研究人員實(shí)現(xiàn)了對(duì)多種工業(yè)微生物GEM的重構(gòu)與迭,并應(yīng)用這些GEM實(shí)現(xiàn)了工業(yè)細(xì)胞工廠代謝網(wǎng)絡(luò)的數(shù)字化設(shè)計(jì)(表2)。

生物逆合成工具輔助細(xì)胞工廠異源途徑設(shè)計(jì)
在進(jìn)行全新化合物或從未在細(xì)胞工廠中完成從頭合成的化合物的細(xì)胞工廠構(gòu)建過程中,需要大量的時(shí)間精力進(jìn)行未知途徑的解析及途徑設(shè)計(jì),且這個(gè)過程強(qiáng)烈依賴專家知識(shí)。數(shù)字細(xì)胞工廠通過生物逆合成策略,結(jié)合數(shù)據(jù)庫(kù)中數(shù)據(jù)信息,針對(duì)目標(biāo)分子,通過反應(yīng)規(guī)則、機(jī)器學(xué)習(xí)等方法,利用酶的雜泛性拓展酶催化反應(yīng)空間,將目標(biāo)分子復(fù)雜結(jié)構(gòu)逆向解析,以細(xì)胞工廠內(nèi)源代謝物為逆合成目標(biāo)終點(diǎn),實(shí)現(xiàn)細(xì)胞工廠外源代謝途徑的逆合成設(shè)計(jì)。逆合成設(shè)計(jì)結(jié)合上述章節(jié)中介紹的酶的從頭設(shè)計(jì)、再設(shè)計(jì),及細(xì)胞工廠代謝網(wǎng)絡(luò)數(shù)字化設(shè)計(jì),形成完整的目標(biāo)分子細(xì)胞工廠代謝途徑設(shè)計(jì)。
生物逆合成在目標(biāo)分子異源合成途徑設(shè)計(jì)中,根據(jù)原理和實(shí)現(xiàn)難易程度,可以分為2類:基于已知酶、代謝反應(yīng)的知識(shí)庫(kù)搜索方法;基于反應(yīng)規(guī)則提取或機(jī)器學(xué)習(xí),預(yù)測(cè)未知的、新的酶促反應(yīng)的方法。這2種方法可以進(jìn)行組合,實(shí)現(xiàn)更貼合實(shí)驗(yàn)設(shè)計(jì)思路的逆合成路徑設(shè)計(jì)。
基于知識(shí)庫(kù)搜索的途徑設(shè)計(jì)方法由于無法超越數(shù)據(jù)庫(kù)中數(shù)據(jù),受限于已知酶促反應(yīng)的數(shù)據(jù)規(guī)模。通過蒙特卡洛樹搜索(MCTS)、無環(huán)路徑搜索等算法,構(gòu)建了DESHARKY、Metabolic tinker等軟件,實(shí)現(xiàn)了基于已知酶促反應(yīng)的逆合成途徑設(shè)計(jì),成功發(fā)現(xiàn)碳利用率、能量利用率更高的新途徑,并應(yīng)用在細(xì)胞工廠構(gòu)建中。
在新酶促代謝反應(yīng)預(yù)測(cè)方面,按拓展新酶促反應(yīng)的方法可分為:基于反應(yīng)規(guī)則的逆合成設(shè)計(jì)方法、無模板逆合成設(shè)計(jì)方法、半模板逆合成設(shè)計(jì)方法。
基于反應(yīng)規(guī)則的逆合成設(shè)計(jì)通過原子—原子映射等方法從已知數(shù)據(jù)庫(kù)中提取反應(yīng)規(guī)則,并使用標(biāo)準(zhǔn)化方法形成反應(yīng)規(guī)則數(shù)據(jù)庫(kù)。例如,RetroRules、Ni等從MetaCyc數(shù)據(jù)庫(kù)抽提并精簡(jiǎn)的包含1 224條反應(yīng)規(guī)則的規(guī)則數(shù)據(jù)庫(kù);RetroBioCat軟件使用的包含99條的極簡(jiǎn)反應(yīng)規(guī)則數(shù)據(jù)庫(kù)等;通過MCTS等算法構(gòu)建逆合成途徑設(shè)計(jì)軟件,基于RetroRules的RetroPath2.0、RetroPath RL、RetroBioCat等。
無模板逆合成設(shè)計(jì)方法使用反應(yīng)數(shù)據(jù)庫(kù)來訓(xùn)練機(jī)器學(xué)習(xí)模型,將“反應(yīng)物—產(chǎn)物信息對(duì)”視為翻譯過程,使用自然語言處理(NLP)進(jìn)行模型構(gòu)建,實(shí)現(xiàn)逆合成反應(yīng)途徑的拓展,基于此方法已開發(fā)了BioNavi-NP、基于酶EC號(hào)的預(yù)測(cè)模型等算法或軟件。
基于反應(yīng)規(guī)則的逆合成設(shè)計(jì)結(jié)果中,通過反應(yīng)數(shù)據(jù)庫(kù)—反應(yīng)規(guī)則數(shù)據(jù)庫(kù)的映射關(guān)系可以提供預(yù)測(cè)途徑的酶參考信息,可以基于已有信息進(jìn)行酶的數(shù)字化設(shè)計(jì),但設(shè)計(jì)的途徑受限于反應(yīng)規(guī)則數(shù)據(jù)庫(kù)。而無模板逆合成設(shè)計(jì)方法通過機(jī)器學(xué)習(xí),極大拓展了酶促反應(yīng)空間,但由于酶促反應(yīng)數(shù)據(jù)量對(duì)于機(jī)器學(xué)習(xí)而言仍然較小,其準(zhǔn)確性仍有待提高。而基于深度學(xué)習(xí)開發(fā)的半模板逆合成設(shè)計(jì)軟件,如RetroPrime、G2Retro則通過分子圖捕捉分子結(jié)構(gòu)特征,解決了無模板方法中已有SMILES式為唯一輸入使得模型無法理解分子結(jié)構(gòu)信息的問題。半模板方法通過預(yù)測(cè)反應(yīng)中心提高了模型的可解釋性,并通過深度學(xué)習(xí)保證了逆合成預(yù)測(cè)的拓展能力和多樣性。
基因線路數(shù)字化設(shè)計(jì)調(diào)控基因時(shí)序表達(dá)
為了滿足細(xì)胞工廠基因表達(dá)的時(shí)序調(diào)控、不同代謝模塊之間的代謝通量調(diào)節(jié)等需求,需要進(jìn)行基因的邏輯、時(shí)序、定量表達(dá)調(diào)控、多基因同時(shí)表達(dá)調(diào)控等邏輯門基因線路設(shè)計(jì)。完成這些設(shè)計(jì)需要使用誘導(dǎo)型啟動(dòng)子、基于特定DNA序列靶向蛋白的啟動(dòng)子抑制、轉(zhuǎn)錄因子等轉(zhuǎn)錄調(diào)控工具。面對(duì)多基因的邏輯構(gòu)建等復(fù)雜問題,手動(dòng)設(shè)計(jì)時(shí)間成本高、準(zhǔn)確性低,而基因線路自動(dòng)化設(shè)計(jì)(GDA)可以快速將標(biāo)準(zhǔn)化基因元件組裝和設(shè)計(jì)成具有所需功能的基因線路。
GDA基于標(biāo)準(zhǔn)化元件庫(kù),實(shí)現(xiàn)基因線路的數(shù)字化設(shè)計(jì)。研究人員使用合成生物學(xué)開放語言(SBOL)、系統(tǒng)生物學(xué)標(biāo)記語言(SBML)等方法構(gòu)建了SynBioHub、Addgene、iGEM等標(biāo)準(zhǔn)化基因元件數(shù)據(jù)庫(kù)?;谶@些數(shù)據(jù)庫(kù),開發(fā)了SBOLCanvas、iBioSim、Cello、SynBioSuite等GDA軟件,實(shí)現(xiàn)基因線路快速精準(zhǔn)數(shù)字化設(shè)計(jì),其中Cello軟件的基因線路設(shè)計(jì)在大腸桿菌、酵母菌、多形擬桿菌等細(xì)胞工廠中已有廣泛的應(yīng)用。
細(xì)胞工廠發(fā)酵工藝與過程數(shù)字化
獲得高性能細(xì)胞工廠后,為使其能夠?qū)崿F(xiàn)目標(biāo)產(chǎn)物工業(yè)規(guī)模發(fā)酵生產(chǎn),需要將發(fā)酵體系逐級(jí)放大以優(yōu)化發(fā)酵工藝與過程參數(shù),實(shí)現(xiàn)產(chǎn)品的高效生產(chǎn)。面對(duì)生物發(fā)酵體系復(fù)雜、缺乏有效傳感器、測(cè)樣頻率低、檢測(cè)時(shí)間長(zhǎng)導(dǎo)致時(shí)效性差等一系列問題,工業(yè)級(jí)發(fā)酵過程的數(shù)字孿生與優(yōu)化控制有助于發(fā)酵體系的控制和產(chǎn)量的提高(圖3)。

發(fā)酵體系放大及發(fā)酵過程控制數(shù)字化
在發(fā)酵工藝的設(shè)計(jì)過程中,放大效應(yīng)的存在致使工藝設(shè)計(jì)與實(shí)際工業(yè)生產(chǎn)環(huán)境不匹配,影響細(xì)胞工廠合成效率。通過數(shù)字孿生,及其與知識(shí)圖譜結(jié)合等數(shù)字化手段,可對(duì)發(fā)酵過程進(jìn)行數(shù)字化模擬及實(shí)時(shí)監(jiān)控,并對(duì)發(fā)酵過程進(jìn)行自動(dòng)化控制,實(shí)現(xiàn)發(fā)酵工藝的優(yōu)化。
在發(fā)酵工藝中,數(shù)字孿生通過接受發(fā)酵過程產(chǎn)生的實(shí)時(shí)數(shù)據(jù),如發(fā)酵體系溶氧(DO)、尾氣分析、溫度等,進(jìn)行仿真、預(yù)測(cè),分析發(fā)酵狀態(tài),并根據(jù)發(fā)酵狀態(tài)對(duì)發(fā)酵體系進(jìn)行優(yōu)化和決策。通過人工智能,結(jié)合實(shí)際發(fā)酵體系,可以實(shí)現(xiàn)中試級(jí)別、生產(chǎn)級(jí)別發(fā)酵體系的數(shù)字孿生模型構(gòu)建,并實(shí)現(xiàn)產(chǎn)物產(chǎn)量的提高。將基于關(guān)鍵因素間關(guān)系專家知識(shí)的知識(shí)圖譜方法與數(shù)字孿生結(jié)合,構(gòu)建兩種方法的整合決策模型,可以提高預(yù)測(cè)準(zhǔn)確性并增強(qiáng)控制性能。
發(fā)酵車間數(shù)字化管理系統(tǒng)設(shè)計(jì)
在工業(yè)生產(chǎn)中,設(shè)備、原料、人力等資源的時(shí)空調(diào)度同樣是保證發(fā)酵工藝過程、工業(yè)生產(chǎn)效率的重要因素。在“工業(yè)4.0”的概念基礎(chǔ)下,對(duì)工業(yè)生產(chǎn)過程進(jìn)行信息化建設(shè),構(gòu)建企業(yè)資源計(jì)劃(ERP)系統(tǒng),并結(jié)合自動(dòng)化系統(tǒng),開發(fā)了制造執(zhí)行系統(tǒng)(MES),實(shí)現(xiàn)數(shù)據(jù)實(shí)時(shí)采集、管理,并進(jìn)行資源、設(shè)備的調(diào)度,構(gòu)建發(fā)酵車間層次的管理數(shù)字化軟件,實(shí)現(xiàn)了發(fā)酵過程成本降低及生產(chǎn)效率的提高。
數(shù)字細(xì)胞工廠總結(jié)與展望
基于人工智能、模型構(gòu)建等的數(shù)字化方法已經(jīng)在細(xì)胞工廠構(gòu)建的全流程中得到了廣泛的應(yīng)用。相比傳統(tǒng)細(xì)胞工廠設(shè)計(jì)方法,數(shù)字化設(shè)計(jì)具有高效、節(jié)約成本等優(yōu)勢(shì)。在以細(xì)胞工廠為核心的綠色生物制造高速發(fā)展的背景下,細(xì)胞工廠設(shè)計(jì)數(shù)字化進(jìn)程正在不斷加快,形成了包括數(shù)據(jù)庫(kù)構(gòu)建、細(xì)胞工廠代謝設(shè)計(jì)、發(fā)酵體系設(shè)計(jì)、發(fā)酵過程調(diào)控等的細(xì)胞工廠全生命周期數(shù)字化設(shè)計(jì)(圖1)。隨著未來計(jì)算能力的提升及更深入的學(xué)科交叉,全生命周期數(shù)字化細(xì)胞工廠設(shè)計(jì)將向更準(zhǔn)確、更快速、更高效、全流程的方向發(fā)展,賦能綠色生物制造。
(作者:孟繁澤、秦磊,清華大學(xué)化學(xué)工程系 清華大學(xué)工業(yè)生物催化教育部重點(diǎn)實(shí)驗(yàn)室 清華大學(xué)合成與系統(tǒng)生物學(xué)中心;曹銳,新疆大學(xué)智能科學(xué)與技術(shù)學(xué)院;胡冰,北京理工大學(xué)化學(xué)與化工學(xué)院生物化工研究所;李春,清華大學(xué)化學(xué)工程系清華大學(xué)工業(yè)生物催化教育部重點(diǎn)實(shí)驗(yàn)室清華大學(xué)合成與系統(tǒng)生物學(xué)中心 北京理工大學(xué)化學(xué)與化工學(xué)院生物化工研究所?!吨袊?guó)科學(xué)院院刊》供稿)







