科研碎碎念:一文讲懂世界模型的前世今生

科研碎碎念:一文讲懂世界模型的前世今生

10天前

当前的人工智能(AI)领域,无疑被大型语言模型(LLM)的辉煌成就所定义。以GPT-4为代表的模型已经掌握了语言的复杂性,展现出惊人的文本生成、摘要和对话能力 。然而,LLM的巨大成功也愈发清晰地揭示 …

又一推理新范式:将LLM自身视作「改进操作符」,突破长思维链极限

又一推理新范式:将LLM自身视作「改进操作符」,突破长思维链极限

14天前

机器之心报道 机器之心编辑部 推理训练促使大语言模型(LLM)生成长思维链(long CoT),这在某些方面有助于它们探索解决策略并进行自我检查。虽然这种方式提高了准确性,但也增加了上下文长度、tok …

估值840亿AI实验室再放大招,他们要给大模型戴上「紧箍咒」

估值840亿AI实验室再放大招,他们要给大模型戴上「紧箍咒」

24天前

刚刚,OpenAI前CTO Mira Murati创办的Thinking Machines Lab再次发布成果! 这是他们继《克服LLM推理中的不确定性》(Defeating Nondetermini …

Agent时代来临:一文读懂大模型Agentic Reasoning框架

Agent时代来临:一文读懂大模型Agentic Reasoning框架

1个月前

近年来,大型语言模型(LLM)的推理能力取得了显著进展,催生了众多展现出接近人类水平性能的LLM-based Agent系统。然而,这些系统虽然都以LLM为核心,但其推理框架在引导和组织推理过程上却各 …

构建可靠AI Agent:从提示词、工作流到知识库的实战指南

构建可靠AI Agent:从提示词、工作流到知识库的实战指南

2个月前

Agent系统由五个关键组件构成: 大语言模型(LLM) 提示词(Prompt) 工作流(Workflow) 知识库(RAG) 工具(Tools) LLM和工具调用已经形成了相对标准化的技术栈。LLM …

如何训练你的大型语言模型

如何训练你的大型语言模型

2个月前

打造一个听起来很智能的大型语言模型 (LLM) 助手,就像在反复塑造泥塑一样。你从一块泥土开始,把它挤压成一个可行的结构,然后开始精雕细琢,直到最终成品。越接近最终成品,那些精妙的点缀就越重要,正是这 …

预训练通往AGI之路已死?杨立昆揭示了LLM无法跨越的认知鸿沟

预训练通往AGI之路已死?杨立昆揭示了LLM无法跨越的认知鸿沟

3个月前

多年来,人工智能领域的三巨头之一、Meta首席AI科学家杨立昆(Yann LeCun)一直对主流大型语言模型(LLM)背后技术路线持怀疑态度。 杨立昆表示:自回归模型烂透了 他认为,当前主流的自回归模 …

ChatGPT上瘾,大脑萎缩47%!MIT祭出206页92图超长报告

ChatGPT上瘾,大脑萎缩47%!MIT祭出206页92图超长报告

4个月前

编辑:KingHZ 【新智元导读】AI上瘾堪比「吸毒」!MIT最新研究惊人发现:长期依赖大模型,学习能力下降、大脑受损,神经连接减少47%。AI提高效率的说法,或许根本就是误解! ChatGPT正在「 …

AI 智能体架构设计的12条原则

AI 智能体架构设计的12条原则

4个月前

大家好,我是玄姐。 ▼618专场直播超级干,预约保你有收获 首先我们回顾下智能体的本质是什么? 如上图所示,智能体的核心在于其如何接收指令、执行任务并做出决策。以下是其关键组成部分: Prompt(提 …

LLM知识蒸馏新突破:90%参数压缩,图像融合效果不减反增!

LLM知识蒸馏新突破:90%参数压缩,图像融合效果不减反增!

5个月前

            龙哥寄语:当大模型遇见蒸馏术,就像把百科全书装进了口袋书——这份来自中科大的’瘦身秘籍’,让图像融合既保住了智慧,又甩掉了赘肉!         论文标 …