上海交大教授的“AI造神”
长期以来,蛋白质设计改造面临着时间长、成本高、试错密集的难题。一款优质的蛋白质产品诞生,往往需要专家丰富的经验和数以万计的实验。
然而,上海交通大学洪亮教授团队的最新成果,让这一切迎来转机。
该团队将AI与蛋白质设计改造相结合,建立了全球最大的蛋白质数据集Venus- Pod。
这个数据集含有近90亿条蛋白质序列,是美国ESM-C模型训练用的21亿蛋白质序列的4倍体量,还包含数亿个功能标签。
如此庞大的数据,就像一座巨大的“蛋白质矿藏”,为AI模型提供了丰富的学习资料,助力生物医药和合成生物学快速发展。
基于这个数据集训练的Venus系列模型,更是表现卓越。
它不再执着于蛋白质的结构,而是直接瞄准“功能预测”这一终极目标。Venus系列模型具备“AI定向进化”与“AI挖酶”两大核心功能。
“AI定向进化”能对不尽如人意的蛋白质产品性能进行优化,让它成为满足应用需求的“六边形战士”。
“AI挖酶”则能精准发掘具备超常规功能的蛋白质,如极度耐热、耐酸碱等,这些蛋白质在生物技术、医药研发和工业生产中潜力巨大。
配合Venus系列模型的全球首款低通量大体积蛋白质表达、纯化与功能检测自动化一体机,效率惊人。
它可在24小时内不间断完成100余个蛋白质的表达、纯化与检测任务,较人力效率提高近10倍,大大降低了研发成本。
在商业应用方面,Venus系列模型已经取得了显著成果。
以国内生长激素龙头金赛药业的单域抗体耐碱性改造为例,洪亮团队借助该模型结合少量湿实验闭环迭代验证,不到1年将普通单域抗体耐碱性提升4倍。
每年为金赛药业节约上千万元成本,还实现了多个批次5000升放大生产,成为全球首款由大模型设计并规模化生产的蛋白质产品。
另外,对某体外诊断头部公司碱性磷酸酶(ALP)的改造项目也十分成功,Venus系列模型使ALP分子活性超国际头部公司产品3倍。
为超敏检测诊断如心肌梗塞、阿尔兹海默症带来巨大价值,目前改造后的ALP已进入200L规模放大生产阶段。
AI与蛋白质设计的结合的科技Venus,不仅将更高效地解决行业难题,还在商业应用中展现出强大实力。
医药、生物学和人工智能领域的跨界科学家与企业家,正在为人类的爱与美,创造神奇的未来。
中科院天工所的生物deepseek这是一个段落,这是一个段落,这是一个段落,这是一个段落,这是一个段落,这是一个段落,这是一个段落,这是一个段落,这是一个段落,这是一个段落,这是一个段落,这是一个段落,这是一个段落,这是一个段落,这是一个段落,这是一个段落,这是一个段落。
传统生物制造方法在知识整合、数据处理和实验设计方面一直面临着诸多挑战。
就像一个被束缚住手脚的运动员,难以在工业化应用的赛场上尽情奔跑。
不过别担心,现在有了生物制造与大语言模型的结合的新“武器”。
最近,中国科学院天津工业生物技术研究所生物设计中心开发了基于大预言模型(LLMs)的SynBioGPT菌种改造专家系统。
这个系统可不简单,它整合了51,777篇文献摘要和23,318篇开放文献,就像是一个装满了生物制造知识宝藏的巨大仓库。
有了它,我们可以进行查询问现、基因突变、产品查询和竞争途径探索等操作,简直就是生物制造领域的“超级大脑”。
而且团队还打造了SynBioGPT的线上版本,用户注册后就能体验。地址如下:https://synbiogpt.,欢迎大家试用(后台也在加紧拓展带宽)。
SynBioGPT的工作,是由中国科学院天津工业生物技术研究所生物设计中心马红武联合圣路易斯华盛顿大学Yinjie J. Tang研究团队共同发表的。
他们结合检索增强生成(RAG)后,大模型的回答准确性从25%显著提升至85%,其中Qwen1.5和Llama3模型表现尤为突出。
这就好比给原本有些迷糊的大脑装上了一个精准的导航系统,让它在生物制造的知识海洋中能够准确地找到方向。
那么大语言模型在生物制造领域到底有哪些神奇的应用呢?赋能DBTL(设计-构建-测试-学习)循环。
细胞工厂的开发离不开酶工程、途径设计和发酵优化,而DBTL循环则是研发的关键环节。
大语言模型可以为菌株工程提供有效策略,就像一位经验丰富的教练,指导着运动员在赛场上发挥出最佳水平。
最近的研究证明,LLMs可以通过从超过29,000个条目中提取大规模代谢工程方法来增强DBTL循环,涵盖1210种产品和751种生物体。
而且,具有RAG的模型不仅可以为酵母途径工程提供遗传靶点和实验设计,还能引导新的生物合成途径假设。
此外,LLMs还可以与白盒模型集成,助力生物制造的商业决策。
未来,大语言模型还将打造基于AI Agent的自动化实验室。
“AI科学家”将利用大模型协助人类科学家进行大规模分析和重复性DBTL任务执行。
它可以协助任务规划、自动化实验设计和规划,还能支持信息组织、子任务推理等。
不过,目前大语言模型在生物制造产业中的应用并不广泛,还面临着多模态和非结构化数据整合等问题。
但这也意味着巨大的发展潜力,未来需要学术界和工业界共同推动,研究出更多的计算工具和研究范式。
你觉得大语言模型会给生物制造领域带来怎样的变革呢?
天津+AI+合成生物,会否带来新增长点?
天津大学合成生物前沿研究院的实力突出。
早在2006年,天津大学就进军合成生物领域,是我国最早开展合成生物学研究的机构之一。
这里汇聚了包括院士、长江学者、杰青等在内的百余人研究队伍。

2012年,天津大学与武清区人民政府合作共建天津大学合成生物前沿研究院,由中国科学院院士元英进领衔。
研究院现有2万平米的产业服务平台,包括5000平米GLP实验动物中心、人工细胞工厂构筑平台及生物合成全流程自动化平台。
截至目前,“天大+武清”模式已经初步跑通。
研究院已经与武汉嘉必优、浙江新化、浙江医药等一批行业领军企业开展技术合作,并孵化培育了番茄红素、香茅醇等一批可产业化的科技成果。
以番茄红素为例,合成生物技术的应用使得其生产效率大幅提高,成本显著降低,市场竞争力大大增强。
从市场数据来看,合成生物市场规模正在迅速增长。
根据相关机构预测,到2025年,全球合成生物市场规模将达到200亿美元,年复合增长率超过20%。
而“AI+合成生物”的结合,将进一步加速这一市场的发展。
在这次合作中,武清区聚焦在应用端,邀请华熙生物、国药集团等行业龙头企业,与天大前沿院邀请的企业研发人员共同加入,共同训练大模型。
这种产学研用深度融合的模式,将加速科技成果的转化,为经济发展注入新动力。
“AI+合成生物”是未来极具潜力的领域,天津大学合成生物前沿研究院与智谱华章的合作,叠加“天大+武清”模式的实践,为这一领域的发展提供了新的范例。
相信在各方的共同努力下,“AI+合成生物”将成为天津乃至全国经济发展的新增长点。
您所在的城市也在布局“AI+合成生物”这个新兴领域么?
天津+AI+合成生物,会否带来新增长点?
AI+合成生物,可以有什么形态?
前面几期视频,我分享了AI+生物反应器、AI+蛋白质分析和预测平台、AI+生物大语言模型、AI助力城市的生物制造产业建设。
今天分享的是AI驱动生物制造研发及中试示范基地建设项目,这有可能成为生物制造中试平台的新标杆。
这个基地来自于安徽的上市公司华恒生物,这可不是初出茅庐的小角色。
它成立于2005年04月13日,快要到20岁生日啦!
华恒生物是一家以合成生物技术为核心,专业从事生物基产品研发、生产、销售的国家火炬重点高新技术企业。
其主要产品如丙氨酸系列、缬氨酸、D-泛酸钙等,广泛应用于动物营养、日化护理等众多领域。其中丙氨酸销量全球第一。
此次公示的新基地项目,第一期投资高达3.9亿元,其中环保投资1500万元,占比3.85%。
项目选址在合肥市长丰县,预计2026年5月投产。
该项目占地142亩,一期建筑面积约3万平方米。
建成后,将成为集研发、试验、试产、检测和服务等多种功能于一体的人工智能生物制造柔性、撬装和积木式技术创新和产品创制基地,预计形成年综合中试规模5500吨。
从产品方案来看,一期拟建设多条中试线,包括:
-
年产10吨的橙花叔醇中试线
-
年产10吨的红没药醇中试线
-
年产380吨的D-泛醇中试线
-
规模年产800吨L-瓜氨酸中试线
-
年产1200吨的半胱氨酸中试线
-
年产1500吨的组氨酸中试线
-
年产1600吨的L-丝氨酸中试线
在大单品上,年产千吨都只能称为中试产线,可见产品在市场上的巨大需求。
华恒生物的这个基地项目,既有公司自身的技术和工艺实力作为支撑,又符合行业的发展方向——
生物制造行业智能化、绿色化的发展趋势已锐不可当。
产业内的公司必须快速找到新的增长点,建立新的市场壁垒,进一步提升竞争力。
尽管在公开报道中并未明确获知基地的人工智能驱动的具体体现,但要在安徽合肥这片集约的土地上生产大宗产品,一定有提高生产效率和降低生产成本的商业秘诀,期待进一步的信息披露。
相信坚持听到这里的朋友,有的可能会吐槽,为什么大家都要蹭人工智能这个热点。
但如果人工智能真能帮我们获得物美价廉的产品,让我们享受技术进步的便捷与高效,为何不乐见其成呢?
还是那句老话,股市有风险,投资需谨慎。
您要是一边吐槽蹭热点一边暗戳戳地买股票,那我只能祝您得偿所愿!