关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻289人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

官方披露:正厅级崔建平被查当月还在捞钱

扬子晚报 浏览 232

俄乌“和平计划”又生变 欧洲“强有力”回应特朗普批评

环球网资讯 浏览 199

大S逝世一周年!S妈现身雕像揭幕,生前最后时光曝光,自曝没遗憾

萌神木木 浏览 156

顶流男星陷“禁演”罗生门?

仙女事件簿 浏览 68

奇瑞QQ3纯电版要来了 轴距2700mm

网易汽车 浏览 147

看了鲁豫对章小蕙的采访,最大感触是这一点

黎贝卡的异想世界 浏览 137

丰田辟谣与比亚迪技术合作,网友的评论,能让丰田章男能背过气去

小李车评李建红 浏览 188

雷军直播四小时回应质疑

大象新闻 浏览 169

阿信演唱会摔下舞台,相信音乐发声报平安:结束后有专业人员检查

扒虾侃娱 浏览 180

谷歌间接承认 Tensor G5 芯片 GPU 问题

IT之家 浏览 302

瓜帅:维拉一直是最难对付的对手;多库的1对1能力让他很特别

懂球帝 浏览 283

A股公司老总被抓宣布离婚 80后前妻分9.24亿紧急接班

每日经济新闻 浏览 247

虞书欣人设崩塌史:从“哇哦”顶流到塌房废墟的

哲学船 浏览 414

贵州2岁女童家门口失踪 父亲已去世母亲独自在外打工

红星新闻 浏览 323

U20世界杯4强出炉

体坛周报 浏览 237

男人至死是少年!61岁李国庆与白月光再婚

联友军事 浏览 423

快船今日首发中有4人34+岁,NBA近9年来首队

懂球帝 浏览 172

成都500万新房交付2年湖景没了墙倾了 车库成"水帘洞"

封面新闻 浏览 454

百亿之后,珀莱雅失速

斑马消费 浏览 713

最高奖励100万元!比亚迪「亮剑」,对「黑公关」现象零容忍!

懂财帝 浏览 3552

戴森新一代无叶冷暖风扇AM15发布,首发价3790元

IT之家 浏览 220
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4