关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻229人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

大S逝世一周年!S妈现身雕像揭幕,生前最后时光曝光,自曝没遗憾

萌神木木 浏览 64

马斯克2025最新深度长访谈:从政府效率到宇宙尽头

不看车bukanche 浏览 118

土拍市场延续“缩量提质”百强房企今年前两月拿地超950亿元

商业观察杂志社 浏览 121

剑指Anthropic十亿美元级市场!谷歌杀入AI编码大战,与Replit达成多年合作

华尔街见闻官方 浏览 5854

队记称开拓者捡漏杨瀚森:有首轮中段最高上限之一 与克林根互补

罗说NBA 浏览 434

‍2025年4部新片亏8亿,古天乐终于拿出这部大片

靠谱电影君 浏览 246

爆破试验带你看巡飞弹飞龙-60A有多强

环球网资讯 浏览 268

联合国安理会通过决议,将对海地制裁延期一年

界面新闻 浏览 1032

TA:布莱顿也有意乔-戈麦斯但时间不够,球员愿意留在利物浦

懂球帝 浏览 327

沈梦辰杜海涛宣布喜讯,3年了终于等来了今天!

Yuki女人故事 浏览 587

美国宣布对伊朗最新制裁措施

央视新闻客户端 浏览 64

伊姐周六热推:电视剧《年少有为》;电视剧《有罪之身》......

伊周潮流 浏览 74

官宣!国足3月参加FIFA系列赛,过招两大世界杯劲旅+非洲杯5冠王

我爱英超 浏览 75

蒙特利尔大学团队发现让AI"分段思考"的惊人秘密

科技行者 浏览 180

外卖小哥认识美籍幼师5个月闪婚:在电梯里一见钟情

潇湘晨报 浏览 366

田震国籍争议再发酵:明星养病选国外总造质疑

娱乐欣赏图 浏览 128

武契奇预测:48小时内伊朗遇袭

极目新闻 浏览 53

里沙利松:踢日本要展现出与踢韩国一样的强度

懂球帝 浏览 223

累瘫?三战全打满40分钟 从40+9到11+5失误 黑龙江女战神也顶不住

颜小白的篮球梦 浏览 237

官方声明:王硕威不是福建舰总设计师

界面新闻 浏览 180

2-2!英超疯狂之战:1-2落后 10人曼联压哨绝平 0分变1分

叶青足球世界 浏览 192
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4