ocr – 微精选

9天前

DeepSeek-OCR 本地部署（上）：CUDA 升级 12.9，vLLM 升级至最新稳定版大家好，我是 Ai 学习的老章大模型 OCR 的黄金时代来了，小红书 dots.ocr-3b、deep …

23天前

把一张纸质表格塞进扫描仪，30秒后，Excel里已经跳出可编辑的单元格，连合并单元格都原样保留——这不是Adobe，也不是ABBYY，而是一款完全免费、断网也能跑的开源小钢炮：Umi-OCR。它最新 …

1个月前

打开今日头条查看图片详情过去一年，大模型世界像一场“算力奥运会”：谁的参数更大、Bench 更高、吞吐更快，就能赢得下一轮融资与流量。但 DeepSeek-OCR 的出现，像是在赛道中间立了一块新 …

1个月前

打开今日头条查看图片详情大型语言模型（LLM）的“上下文窗口”军备竞赛正将其推向一个根本性的计算悬崖。从几千个token到百万，乃至千万token，这场竞赛的背后是Transformer架构的核心瓶 …

5个月前

「OCRFlux」是什么？它是一款轻量级多模态大语言模型的工具包，主要功能是把PDF转换为Markdown文件，它的优势是可以解决复杂的排版解析、复杂的表格解析和跨页内容合并这些难点问题 …

1年前

视觉/图像重磅干货，第一时间送达! OCR 方向的工程师，之前一定听说过 PaddleOCR 这个项目。目前项目累计 Star数量已超过 43k+ ，安装包月下载量超过 40w+ 。滑动查看更多图片 …

微精选