真心建议:每天进行800字的自由写作练习
5个月前“hi我是喜喜,一个靠写作旅居世界的自由职业者,无限游戏新玩家~” 800字,是不是觉得字数还挺多的? 别怕,跟着下面的四个写作方向走,等你真正写起来,就很难刹住啦! 一、写你的一天 先从记你的日常流 …
Kimi 16B胜GPT-4o!开源视觉推理模型:MoE架构,推理时仅激活2.8B
5个月前刚刚,Kimi团队上新了! 开源轻量级视觉语言模型Kimi-VL及其推理版Kimi-VL-Thinking,多模态和推理双双拿捏。 按照Kimi官方的说法,其关键亮点如下: 都是基于MoE架构,总参数 …
十个关键词,带你全面看懂DeepSeek!
5个月前DeepSeek的火热仍在持续。 相信很多读者在使用DeepSeek的时候,都会默认开启深度思考功能,风叔在阅读DeepSeek思考过程上的时间,甚至比最终回答还要多。 这是风叔在使用其他大模型时,从 …
从大模型、智能体到复杂AI应用系统的构建——以产业大脑为例
7个月前大模型的出现是AI技术发展的重要里程碑。从2017年Transformer架构的提出,到2022年ChatGPT的横空出世,大模型在短短几年间实现了从实验室到大众应用的跨越。 大模型的能力在不断增长, …
一文彻底搞懂深度学习 – 训练和推理(Training vs Inference)
8个月前在深度学习中,训练和推理是两个紧密相关但又有所不同的阶段。训练过程通过调整模型参数来优化模型性能,而推理过程则利用训练好的模型进行预测。 训练和推理在目标、过程、计算资源等方面存在差异。训练过程注重模 …
度小满,让“推理大模型”走向金融核心业务
1年前最近一段时间,AI领域被谈及最多的关键词是“推理大模型”。 今年9月,OpenAI发布了o1大模型,这种具有“慢思考”能力的大模型最大特点是能够推理复杂的任务,可以解决科学、编程、数学等领域更为复杂的 …
《逻辑19讲》:学会辨别好坏推理之间的差别
1年前生活中我们经常说某人逻辑思维清晰,能有理有据的叙述一件事,并给出自己的观点和看法。 逻辑是一种推理科学,清晰的逻辑能帮助我们辨别一个好推理和坏推理之间的差别。 什么是推理呢? 在《逻辑十九讲》这本书里 …
清华开源混合精度推理系统MixQ,实现大模型近无损量化并提升推理吞吐
1年前来源:量子位 编辑:硕博生活圈 “慧眼观世界,关注就要发声。大家好,这里是硕博生活圈。” 关注前沿情报👉 PACMAN实验室 投稿量子位 | 公众号 QbitAI 一键部署LLM混合精度推理,端到端吞 …
苹果一篇论文得罪大模型圈?Transformer不会推理,只是高级模式匹配器!所有LLM都判死刑
1年前新智元报道 编辑:peter东 Aeneas 【新智元导读】苹果研究者发现:无论是OpenAI GPT-4o和o1,还是Llama、Phi、Gemma和Mistral等开源模型,都未被发现任何 …