大模型到底是怎么「思考」的?第一篇系统性综述SAE的文章来了
4个月前作者介绍:本篇文章的作者团队来自美国四所知名高校:西北大学、乔治亚大学、新泽西理工学院和乔治梅森大学。第一作者束东与共同第一作者吴烜圣、赵海燕分别是上述高校的博士生,长期致力于大语言模型的可解释性研究 …
MiniMind用极低的成本训练属于自己的大模型
4个月前本篇文章主要讲解,如何通过极低的成本训练自己的大模型的方法和教程,通过MiniMind快速实现普通家用电脑的模型训练。 日期:2025年3月5日 作者:任聪聪 一、MiniMind 介绍 基本信息 在 …
大模型实战手册【2025百度智能云精选案例集】:百度智能云的深度实践与创新(免费下载)
4个月前大模型赋能行业应用 AI技术不是空中楼阁的幻想,而是百度智能云在十大领域中深耕细作的现实成果;它不是冷冰冰的代码,而是温暖人心的智能服务,悄然改变着我们的生活与工作。 在当今人工智能浪潮席卷全球的背景 …
开源大模型, 重量级选手+1
4个月前大家好,我是 Ai 学习的老章 今天大模型开源世界又迎来 1 个重量级选手 MiniMax- M1 我们一起看看 MiniMax-M1 简介 MiniMax-M1 采用了创新的混合专家模型(MoE)架 …
医药行业的投融资、交易、公司信息和投资机构数据查询方法
4个月前一个平静的晚上,我正躺在床上焦虑的刷视频助眠,领导一个电话让我调研某个新兴靶点有哪些公司拿了融资?不急,只是明早要用而已。 此时内心一万头羊驼奔腾过去,还能怎么办呢,为了窝囊费,还是得爬起来干活。 我 …
“心”启未来 | 昂朴hiPSC来源的心肌细胞分化及应用平台介绍(一)
4个月前iPSC(Induced Pluripotent Stem Cell)由体细胞(如皮肤或血细胞)经重编程因子(Oct4、Sox2、Klf4、c-Myc)诱导获得,具有类似胚胎干细胞的多向分化潜能,同时 …
弱智吧入侵AI
5个月前当中科院的研究结果揭晓 用百度贴吧 “弱智吧” 语料训练的 AI 模型, 在 GPT-4 评分中力压知乎、小红书等平台登顶时,整个中文互联网陷入集体困惑: 这个以 “无厘头提问”“反逻辑段子” 著称 …
AI仅凭“自信”学会推理,浙大校友复刻DeepSeek长思维链涌现,强化学习无需外部奖励信号
5个月前复刻DeepSeek-R1的长思维链推理,大模型强化学习新范式RLIF成热门话题。 UC Berkeley团队共同一作Xuandong Zhao把这项成果称为: 大模型无需接触真实答案,仅通过优化自己 …
5位创业者、投资人眼中,能落地的医疗大模型长啥样【2025VBEF】
5个月前5月9日-10日,动脉网与探针资本联合主办了“跃迁重构-医疗AI大模型应用创新论坛”,共同探讨了AI在医药研发、临床应用、医疗服务体验优化、支付体系赋能等维度的最新落地应用趋势。 作为论坛的联合主办方 …
军事仿真平台|作战模型装配工具详解(附完整平台介绍)
5个月前在现代军事领域,作战仿真平台已成为不可或缺的关键要素,某司推出的军事仿真平台,围绕作战仿真事前、事中、事后提供了各种仿真任务的体系化建模、仿真和分析工具,及丰富的全领域物理仿真模型算法,满足了用户在虚 …