What If Your LLM Is a Graph? Researchers Reimagine the AI Stack

摘要

全球知识图谱市场预计到2030年将达到69.3亿美元,年复合增长率为36.6%。三星Galaxy S25和ServiceNow等知名产品已通过收购RDFox和data.world等图技术公司来增强其AI能力。文章深入探讨了知识图谱构建、图数据库引擎、GraphRAG变体、图分析可视化以及图基础模型等前沿技术发展,为专业人员提供了图技术领域的全面洞察。


图技术市场的强劲信号

你相信市场研究报告吗?如果相信,这里有证据#1:全球知识图谱市场预计从2024年的10.6亿美元增长到2030年的69.3亿美元,年复合增长率为36.6%

你相信分析师公司吗?如果相信,这里有证据#2:多达50%的Gartner客户关于AI话题的咨询都涉及图技术的使用讨论

你相信市场信号吗?如果相信,这里有证据#3:基于图的产品如RDFox和data.world正在为三星Galaxy S25和ServiceNow等知名产品提供支持,这些公司都通过收购获得了这些技术

所有这些证据都指向同一个方向:图技术领域在多样性、深度和密度方面都在快速发展,前景积极向好

图技术生态全景

技术生态地图的演进

图技术生态地图自2014年以来一直在帮助描绘图技术世界的格局。其目标是介绍图技术世界中的关键类别,以及这些类别中的关键参与者 。

正如Linkurious的创作者所承认的,这只是一个起点,而非完整列表。对于一个在研发创新和市场增长方面都发展如此迅速的领域,这是不可能做到的 。

跟踪图技术生态需要持续的关注和努力,这就是为什么信息图表和相关报告每5年才更新一次的原因

2024年版本的要点是,越来越多的组织正在采用图技术,因为他们发现它是越来越多用例的资产 。

市场增长的关键驱动因素

根据Research and Markets的《2025年知识图谱研究报告》,图技术采用增长的关键驱动因素包括:

  • 对AI/生成式AI解决方案的不断增长需求
  • 数据量和复杂性的快速增长
  • 对语义搜索的不断增长需求

知识图谱市场估计从2024年的10.6亿美元增长到2030年的69.3亿美元,年复合增长率为36.6%。图数据库引擎部门预计将占据最大的市场份额,而服务部门预计在预测期内注册最快的增长率

Research and Markets指出,缺乏专业知识和认知以及标准化和互操作性是阻碍市场增长的主要挑战

知识图谱作为持久资产的构建与评估

实施复杂性与业务价值

随着知识图谱受欢迎程度的增长,其实施复杂性强调了评估它们是否适合组织用例的需要。这正是Gartner在其题为《如何评估知识图谱对您用例的适用性》的研究报告中所指出的 。

https://www./en/documents/5411463

Gartner在其2024年新兴技术炒作周期中将知识图谱确定为关键使能技术的核心,并指出’添加语义数据集成和知识图谱’是2024年数据集成和工程的十大趋势之一 。

然而,Gartner发现,尽管对知识图谱用例的认识在增加,但投资此类举措的意愿或业务支持度较低。对业务的好处仍然不清楚,组织仍在努力弄清楚何时使用知识图谱来提供业务价值

知识图谱作为组织资本支出

正如Mike Dillinger所指出的,丰富的知识图谱是持久资产——在较长时间内提供实用性或价值的资产,通常在商业或经济背景下。它们通常不打算出售,但对于运营绝对必要,就像其他资产如财产、设备和机械一样

知识图谱是组织的资本支出,应该作为这样来评估。衡量其价值应该基于它们所能实现的功能,从数据治理到AI应用

构建工具和方法

构建知识图谱的工具也不缺乏:

  • iText2KG
    一个Python包,旨在逐步构建具有解析实体和关系的一致知识图谱 
  • WhyHow开源的知识图谱工作室 大模型产品的推理体系结构 – WhyHow.AI
  • OpenSPG(语义增强可编程图)新一代企业知识图谱引擎,由LLM和知识图谱双向增强 

Jessica Talisman提出了本体管道来支持语义知识系统,指出结构化、可扩展的语义知识管理方法可以通过明确定义的ROI指标证明投资合理性,并改善数据质量和治理,这对AI成功至关重要

知识图谱通过并购推动知名品牌

ServiceNow收购data.world

知识图谱代表了认真构建AI的组织的投资,这一点正在被越来越多地理解。ServiceNow理解这一点,并正在收购data.world以更深入地挖掘AI数据

ServiceNow数据和分析产品高级副总裁兼总经理Gaurav Rewari在data.world收购的背景下表示:’根据Gartner焦点小组,4%的技术领导者认为他们的数据已经为AI做好准备——这是相当清醒的。Gartner在另一份报告中继续说,到2026年,60%的AI项目将因数据未准备好而失败。’ 

虽然有其他数据目录专家,但Rewari表示data.world的知识图谱实现使其成为ServiceNow的良好选择。ServiceNow已经具有知识图谱支持,但data.world带来了元数据收集器和知识图谱专业知识,可以进一步丰富ServiceNow的图

三星Galaxy S25的知识图谱技术

今年早些时候,三星推出了新的Galaxy S25系列,其新AI功能基于牛津语义技术公司的技术构建。牛津语义技术公司是牛津大学在2017年由三位世界领先的基于知识AI技术计算机科学教授分拆出来的公司,于2024年7月被三星电子收购 。

该公司的RDFox®技术支持三星的个人数据引擎,利用知识图谱创建超个性化用户体验,将包含在最新的Galaxy S25系列中。联合创始人Ian Horrocks是三星Unpacked活动的演讲者之一 。

知识图谱作为实用AI的关键真相层

组织在AI采用方面面临着一个关键挑战:如何利用其领域特定知识以提供可信结果的方式使用AI。知识图谱可以为AI提供缺失的’真相层’,将概率输出转化为现实世界的业务加速

这是与Tony Seale关于知识图谱作为实用AI关键真相层的深入对话的要点。它涵盖了从知识图谱第一原理到安全、可验证AI的应用模式、现实世界经验、趋势、预测和前进方向的所有内容 。

知识图谱专家Tony Seale预测2025年将是知识图谱与生成式AI融合的关键一年。GraphRAG框架将崛起,云平台将推出核心知识图谱服务,生成模型的推理能力将达到近乎’真正推理’的水平。最重要的是,数据整理将成为组织在AI领域成功的关键因素,’垃圾进,垃圾出’的警告愈发重要。https://www.linkedin.com/posts/tonyseale_here-are-my-predictions-for-knowledge-graphs-activity-7280870517870321664-d4aM/

GraphRAG的丰富变体

尽管GenAI采用存在障碍,或者正是因为如此,通过在受控环境中将GenAI驱动的系统与可信信息相结合来充分利用它们,即RAG(检索增强生成)一直在持续受到关注。GraphRAG变体正在演进并出现自己的变体

有关 Graph RAG 的介绍,请查看“使用 Graph RAG 使数据大众化:它是什么,它能做什么,如何评估它”。Τthis 促成了 Connected Data Knowledge Graph 挑战赛,以及基于 Kuzu 并在 G.V() 上可视化的开源实现。Jakob Pörschmann 还对 Graph RAG 进行了概念性介绍,然后详细介绍了 Google Cloud 堆栈上的实现。

在过去的几个月里,我们看到 Microsoft 开源了其 Graph RAG 实现,提供了一些改进,例如用于快速适应新域和动态社区选择的自动调整,以及发布 LazyGraphRAG。LazyGraphRAG 旨在解决对 Graph RAG 的一个关键批评,即实施成本高昂。但是 Graph RAG 还有更多问题。

这就是为什么像 Irina Adamchic 这样的人想出了解决这些问题的替代方案。Adamchic 引入了一个三层固定实体架构,用于在图形上实现高效的 RAG。它依赖于利用所谓的本体层中的领域知识。她还开发了一种基于 NLP 的变体,该变体不依赖于领域知识,而 Elena Kohlwey 则探索高级 RAG 模式的世界。

相比之下,OG-RAG 是一种 RAG 变体,为大型语言模型提供基于本体的检索增强生成。KET-RAG 承诺提供 10 倍更便宜、更智能的知识检索。MiniRAG 为小语言模型引入了接近 LLM 级的精确 RAG,存储空间仅为 25%。Mindful-RAG 是一个专为基于意图和上下文一致的知识检索而设计的框架。

GFM-RAG 是 RAG 的图基础模型。GNN-RAG 使用图神经检索进行 LLM 推理。NodeRAG 是一种 Graph RAG 变体,它使用具有细粒度语义单元、实体、关系和高级摘要的异构图形,而不是同构图形。SimGRAG 将查询转换为图形模式,并使用图形语义距离指标将它们与候选子图对齐。

mmGraphRAG 利用非文本数据,如图像和音频。PathRAG 通过基于流的修剪有效地减少了冗余信息,同时通过基于路径的提示指导 LLM 生成更合乎逻辑和连贯的响应。CDF-RAG 以迭代方式优化查询,检索结构化的因果图,并支持跨互连的知识源进行多跳因果推理。

对 Graph RAG 的调查正式确定了 GraphRAG 工作流程,概述了每个阶段的核心技术和训练方法,研究了下游任务、应用领域、评估方法和行业用例,并探索了未来的研究方向。

Paco Nathan 在 GraphRAG 中解绑了 Graph,Lettria、Jay Yu 和 May Habib 对其进行了基准测试,Francois Vanderseypen 分享了构建强大解决方案的概念概述,以及一组用于生成和可视化知识图谱的 Graph RAG 开源堆栈。

当你的大模型变成图谱:研究者重新想象AI技术栈

最终,混合 RAG 方法可能被证明足够灵活,可以适应不同的情况。对于许多应用程序,由智能路由器编排的检索方法组合可以提供性能和灵活性的最佳平衡。

GraphRAG技术的发展为传统RAG方法提供了更加结构化和语义化的增强,能够更好地处理复杂的关系数据和上下文信息 。

新兴图数据库引擎与标准化

随着图技术的快速发展,新的图数据库引擎不断涌现,标准化和性能优化成为关键关注点。这些新引擎旨在提供更好的查询性能、更强的可扩展性和更广泛的兼容性 。

G.V()等工具兼容18种不同的图技术且在不断增长,易于使用、成本低、承诺少、供应商不可知,并且与任何安全架构配合良好

图分析与可视化的路线

图分析和可视化平台正在发展,提供更强大的功能和更直观的用户体验。这些平台不仅支持传统的图查询和分析,还集成了机器学习和AI能力,为用户提供更深入的洞察 。

图基础模型与大规模应用

图基础模型代表了图技术和大语言模型融合的最新发展方向。这些模型能够理解图结构数据,并在各种下游任务中发挥作用,从知识推理到关系预测 。

AI缺乏企业特定上下文时,就只是猜测。metaphacts的metis是一个知识驱动的AI平台,将断开的企业数据转化为真正的商业价值

通过metis,企业可以:

  • 在企业语义学中为准确性和信任度奠定AI响应基础
  • 设计和部署具有对话界面的定制知识驱动AI代理
  • 控制和审核企业数据使用
  • 结合摘要、实体链接和查询执行等工具——由业务特定语义学驱动 

技术发展趋势与未来展望

图技术的未来发展将更加注重:

  1. 与AI/ML的深度融合
    :图技术与大语言模型、机器学习算法的结合将产生更强大的智能系统
  2. 标准化和互操作性
    :行业标准的建立将促进不同系统间的协作
  3. 实时处理能力
    :支持大规模实时图数据处理和分析
  4. 云原生架构
    :更好地适应云环境和分布式部署

这些发展趋势表明,图技术正在从一个专门的技术领域转向主流企业技术栈的核心组成部分 。

结语

图技术生态在多样性、深度和密度方面都在快速发展,前景积极向好。从市场预测到实际应用,从技术创新到企业采用,图技术正在重塑我们思考和构建AI系统的方式。

对于专业人员来说,现在是深入了解和投资图技术的关键时刻。无论是构建知识图谱、实施图RAG解决方案,还是开发图基础模型,这些技术都将在未来的AI竞争中发挥关键作用。


标签: #知识图谱 #GraphRAG #KnowledgeGraph #图数据库 #AI技术栈



GraphRAG:用知识图谱与生成式AI开创关系感知的智能新时代


EraRAG:突破传统GraphRAG限制,实现动态语料库的高效检索增强生成


探索AI未来:GraphRAG——更高效智能的跨文档查询方式


知识增强大模型GraphRAG 如何彻底改变阿尔茨海默病的基因研究和治疗 – 美国Cedars-Sinai 医疗中心


GraphRAG + DeepSearch: 下一代企业级人机协同大模型推理架构及医药法律等领域Agent深度详解


GraphRAG:重新定义信息检索的智能革命


九大GraphRAG的全面评估:GraphRAG-Bench基准测试集解析 – 香港理工&腾讯优图等


什么时候GraphRAG超越传统RAG:突破医学等知识密集任务的AI新范式和GraphRAG-Bench评估框架


Graph RAG框架、基本工具和实际用例


基于GraphRAG的妊娠期糖尿病管理本地大模型


HyperGraphRAG:基于超图结构知识表示的新版GraphRAG – 北邮、安贞医院等


多模态GraphRAG初探:文档智能+知识图谱+大模型结合范式