关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻366人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

阿斯:卡瓦哈尔已具备首发的状态,阿诺德预计周末回归名单

懂球帝 浏览 225

"最快女护士"新年第一跑夺冠获1.5万奖金 本人发声

红星新闻 浏览 275

李施嬅困局:被有毒关系猎杀的富家女

仙女事件簿 浏览 351

美国防部将提供“战斧”决定权交给总统

国际在线 浏览 341

2026款奔驰EQE上市 售价47.8-62.7万元

车质网 浏览 320

闫学晶被多个品牌解约,儿子林傲霏“新疆班”的学历也被调查

素素娱乐 浏览 239

德塞利:阿隆索想在切尔西成功,须精简阵容

懂球帝 浏览 20

日方鼓吹拥核 国防部表态

环球网资讯 浏览 249

蜜雪冰城开到公交站乘车享折扣 执法局的人却上门了

每日经济新闻 浏览 304

售13.59万起 2026款深蓝L07正式上市

网易汽车 浏览 484

上市十年,连亏五年!龙津药业面临退市​

国际金融报 浏览 3881

闻泰科技营收147亿的半导体资产被荷兰政府冻结

每日经济新闻 浏览 387

进博面对面|爱茉莉太平洋许达仁:深耕中国,本土创新是制胜关键

中国商报 浏览 1591

央行连续增持黄金,10月我国外汇储备规模稳中有升

中国商报 浏览 1430

古巴启动防空演习 美国航母已部署加勒比海

澎湃新闻 浏览 27

会打扮的中年女人,穿衣都有这4个共同点,难怪优雅又气质

静儿时尚达人 浏览 566

端网深度协同,中国移动5G-A超级上行刷新移动直播体验

环球网资讯 浏览 28

《长安二十四计》惊天逆转:虎贲竟是好人?

宇林网络 浏览 292

斯坦福突破:机器人实现视频动作到真实操作迁移

科技行者 浏览 224

八年生4胎,稳坐豪门阔太宝座,“千亿儿媳”徐子淇真不简单!

娱乐白名单 浏览 741

蒋奇明新片路演:生图五官好嫩像清纯男大

胡一舸南游y 浏览 472
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4