关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻368人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

3名00后全国"刮腻子"团队年入百万:凌晨三点在焊钢架

潇湘晨报 浏览 246

伊姐十一热推:电视剧《入青云》;电视剧《宴遇永安》......

伊周潮流 浏览 421

iPhone Air国行版要来了!联通eSIM预约通道正式开放

三言科技 浏览 363

辽宁加时95-82江苏,赵继伟16+7+8,威尔斯21分

懂球帝 浏览 222

警方通报于朦胧坠亡,3位造谣者被处罚,调取监控排除刑事嫌疑

扒虾侃娱 浏览 430

努诺未来明确,西汉姆联确认新团队成员

绿茵情报局 浏览 227

伊姐周日热推:电视剧《声渊》;电视剧《绝境通缉令》......

伊周潮流 浏览 389

不止本田遭遇“冰雹”,这些跨国车企如何找回“春天”?

禾颜阅车 浏览 173

塞维利亚总监:没有薪资空间引入拉莫斯,目前不考虑补强中卫

懂球帝 浏览 244

上海官博:祝福罗汉琛未来一切顺利 感谢罗队 八年相伴 一路有你

直播吧 浏览 478

夸克上线千问助手,使用阿里Qwen最强大模型

IT之家 浏览 345

全网泪目!《马踏樱花》一夜刷屏

手工制作阿歼 浏览 382

维拉本赛季禁区外进球冠绝英超,甚至比禁区内进球还多

懂球帝 浏览 359

热搜第一!黑神话新作"钟馗"来了,"悟空"还得再等等

国际金融报 浏览 2493

移动联通重押雷鸟创新背后:智能眼镜发出“独立宣言”,欲告别“手机附属品”标签

华夏时报 浏览 277

碧桂园高层调整!联席主席及总裁变更,债务重组有大进展

券商中国 浏览 5252

美媒猜测"中国第六代战机项目"

环球时报国际 浏览 241

以军袭击加沙城社区 至少6人死亡

财联社 浏览 217

斯基拉:国米、那不勒斯已派球探考察比萨中场伊德里萨-图雷

懂球帝 浏览 317

都体:加拉塔萨雷对弗拉泰西开始犹豫,认为他防守属性不够强

懂球帝 浏览 265

钢铁业未见“金九银十” 中钢协呼吁“自律控产”

中国经营报 浏览 2221
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4