关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻279人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

纯电续航215km 全新阿尔法T5增程版10月底将上市

网易汽车 浏览 272

乌代表团赴美谈判 俄乌互相袭击

新华社 浏览 176

2毫米支架颅内“拆弹”,他要跟全球巨头掰掰手腕

中国企业家杂志 浏览 1104

亚马逊历史新高!道指标普月线六连阳,中概股探底回升

第一财经资讯 浏览 1921

央视公开“点名”孙俪,原来张艺谋没说错

银河史记 浏览 264

全国人大代表梁伟:用AI打通中国芯片弯道超车的 “任督二脉”|代表在这里

封面新闻 浏览 41

中科院突破:AI实现持续学习不忘旧知

科技行者 浏览 293

林诗栋嘟嘴新年首胜!赛后直言想多拿冠军 左腿满是肌贴疑存伤病

颜小白的篮球梦 浏览 204

特雷·扬和老鹰正式协商分手 奇才有意围绕CJ报价

体坛周报 浏览 134

运营商保险动作分化:中国移动线下开卖保险,电信旗下两张中介牌照相继摆上货架

蓝鲸新闻 浏览 145

告别巨舰,轻舟竞发:EXO成员的单飞远征时代

仙女事件簿 浏览 177

弱化电动布局 英菲尼迪最新消息曝光

乐选爱车 浏览 378

看大疆做全景相机,不要只看两份报告

连线Insight 浏览 274

利雅得胜利客战利雅得体育:C罗缺阵,菲利克斯、马内先发

懂球帝 浏览 104

全国首个!华为、联通把5G-A上行速率飚到1Gbps

快科技 浏览 118

荣耀MagicOS 10十二月升级资讯:新增支持与Mac一碰互传等

IT之家 浏览 187

演习现场"机器狼"射击画面最新披露

环球网资讯 浏览 377

星华新材再落子 收购天宽科技补齐AI算力“下一块拼图”

财闻 浏览 122

张继科与女友张蕊被拍 被传隐婚生子?

达达哥 浏览 217

从 Meta 拆解、苹果眼镜爆料,看「不科幻但好用」的 AR 眼镜|硬哲学

爱范儿 浏览 285

燕翔:A股上市公司增减持特征与近况

首席经济学家论坛 浏览 1367
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4