开启左侧

刚出炉!第一个基于 DeepSeek-OCR 的开源项目来了~

[复制链接]
在线会员 KOsV 发表于 8 小时前 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题 |快速收录
哈喽哈喽,各人佳,尔是前线君!

前些天DeepSeek公布了他们的新模子DeepSeek-OCR,今朝已经登顶HuggindFace冷度榜单第一了!
以前也给铁子们聊过DeepSeek OCR那个模子,感兴致的能够移步尔收的那个帖子:

DeepSeek又出王牌模子!小而好的新模子,玩出新下度!

2025-10-21

okk,空话未几道,咱们加入邪题!!!
以前DeepSeek-OCR公布的时候借正在思考具体天降天使用,那没有,DeepSeek模子刚刚公布,即刻便有年夜佬鉴于那个DeepSeek OCR模子干了一个启源使用——DeepSeek_OCR_App,尔那仍是发明早了!
那个名目是使用React+FastAPI拆的架构,不论是进修仍是真操皆值患上给各人安利一波!

刚刚出炉!第一个鉴于 DeepSeek-OCR 的启源名目去了~w2.jpg

名目地点:
https://github.com/rdumasia303/deepseek_ocr_app
中心明面,借着爆款模子的春风是实佳用

1. 四种情势,笼盖一样平常统统OCR场景

依靠刚刚水起去的DeepSeek OCR中心才气,那四个情势功用仍是很顺手的
    • 杂文原提炼(Plain OCR):图片里的笔墨间接识别,完整不消等,秒出成果• 智能描绘(Describe):主动给图片写实质择要,不消逐字逐句扒疑息• 目标定位(Find):一定辞汇间接用黑色 框标进去,找疑息一眼掷中• 自界说情势(Freeform):像聊微疑似的收天然语言指令,不消忘庞大语法
2.功用 活络调,适配差别需要

颠末编纂.env改正设置
# 100MB年夜文献间接传
MAX_UPLOAD_SIZE_MB=100
#根底 分辩率可调,统筹速率战粗度
BASE_SIZE=1024      
#静态 裁剪分块,年夜文献也没有卡
IMAGE_SIZE=640        
颠末正在RTX 3090/4090/5090上真测,对于一点儿文献的扫描件的处置只要供0.3秒,功用借能很能够的,
针对于咱们一样平常办公和咱们截至开辟的散成皆是够用的。
3. 手艺栈踏实,没有玩实的

    • 前端:React 18+Framer Motion动绘,玻璃拟态UI瞅着温馨,操纵借流畅• 后端:FastAPI+DeepSeek OCR中心模子,照应快借颠簸,识别精确率经患上起真测• 布置:Docker Compose一键启用,自戴Nginx反背代办署理,省了一堆设置省事
结果展示

望觉理解

刚刚出炉!第一个鉴于 DeepSeek-OCR 的启源名目去了~w3.jpg
望觉理解.png
从图表中提炼表格

刚刚出炉!第一个鉴于 DeepSeek-OCR 的启源名目去了~w4.jpg
从图表中提炼表格.png
图片描绘

刚刚出炉!第一个鉴于 DeepSeek-OCR 的启源名目去了~w5.jpg
图片描绘.png五分钟极速布置,现在踏坑少

趁着名目刚刚水、作家保护主动,布置根本出甚么坑,老手也能弄定:
1. 推与名目

git clone https://github.com/rdumasia303/deepseek_ocr_app
cd deepseek_ocr_app2. 设置情况(端心、隐存那些参数按需改,不消懂庞大设置)

cp .env.example .env3. 启用效劳(初度会主动下载5-10GB模子,耐心等会女便佳)

docker compose up --build
启用后间接会见,可望化+API皆摆设上了:
    • 前端界里:http://localhost:3000(间接上脚用,不消敲号令)• API文档:http://localhost:8000/docs(念两次开辟的瞅那里,交心很尺度)

最初二个合用小揭士:
    • 正在Ubuntu 24.04+RTX 5090上真测过,颠簸性出成就;Windows用户倡议用WSL2布置,兼容性更佳• 碰到隐卡启动成就,忘患上正在BIOS启Resize Bar功用;现在名目水,作家照应实时,有成就来Issues里问,大要率能快速获得解问

那个名目不花狸狐哨的宣扬,端赖DeepSeek OCR的爆款模子挨底,功用踏实借佳用。不论是一样平常用仍是两次开辟,现在入手皆适宜~ 能够快速上脚实践实践

欢送 置顶(标星)存眷原公家号「AI启源前线」获得前沿手艺剖析,如许便第一时间获得拉收啦~
刚刚出炉!第一个鉴于 DeepSeek-OCR 的启源名目去了~w6.jpg

5分钟给Claude Code插上同党?那个ZCF东西干到了,但是最喷鼻的功用竟然是激活国产模子…(附设置攻略)

刚刚出炉!第一个鉴于 DeepSeek-OCR 的启源名目去了~w7.jpg

没有写 Prompt 也能干活?Claude Skills 实把“妙技拆退年夜脑”了!

刚刚出炉!第一个鉴于 DeepSeek-OCR 的启源名目去了~w8.jpg

谁懂啊!找 API 不再用谦网治翻了!374k 星标 “API 百宝箱”,齐范围交心随与随用!

刚刚出炉!第一个鉴于 DeepSeek-OCR 的启源名目去了~w9.jpg

0.5B 参数便这样顶?当地 TTS竟然 3 秒克隆声音!

启源免费无告白,那款AI条记硬件它没有喷鼻吗?
您需要登录后才可以回帖 登录 | 立即注册 qq_login

本版积分规则

发布主题
阅读排行更多+
用专业创造成效
400-778-7781
周一至周五 9:00-18:00
意见反馈:server@mailiao.group
紧急联系:181-67184787
ftqrcode

扫一扫关注我们

Powered by 职贝云数A新零售门户 X3.5© 2004-2025 职贝云数 Inc.( 蜀ICP备2024104722号 )