关闭广告

美团杀入开源大模型混战:LongCat登场,推理速度直破100 Token/s

AI寒武纪361人阅读


美团也推出一款名为 LongCat-Flash 的非推理开源(MIT)大模型,总参数量为 5600亿, MoE架构,激活 186亿至313亿参数(平均约270亿),模型性能看起来还是很不错的,尤其在智能体(Agentic)任务方面表现突出


一大看点是模型采用了 shortcut-connected 架构,扩展了计算与通信的重叠窗口,使推理能够在成本可控的情况下达到每秒100 Token 以上,我刚试了一下速度真的超快

体验地址:

https://longcat.ai

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普内阁会议时长超《泰坦尼克号》 3小时夸声一片

红星新闻 浏览 419

9岁弟弟惨遭杀害命案二审 姐姐剃光了头发

中国新闻周刊 浏览 19

双星鞋业84岁创始人宣布断绝父子关系:儿子抢公章夺权

红星新闻 浏览 187

浙江杭州:外籍人士探跨境电商之道

环球网资讯 浏览 429

17个街道年投入逾亿元 资质错配、服务动力不足何解?

南方都市报 浏览 1159

杨洋传遇上缅北剧组 开机就离开剧组?

陌上桃花开的 浏览 85

女友BELLA+封面 | 高杨:步履稳定,心向未知

伊周潮流 浏览 208

900万粉丝网红到一村庄办杀猪宴:村民收场地费还分肉

极目新闻 浏览 127

外交部回应英国所谓"中国间谍"案

环球网资讯 浏览 275

中微半导涨价,最高50%!机构:AI设施投入持续加大为确定性事件

中新经纬 浏览 168

郑丽文再称"大陆是我们的亲人" 民进党直接跳脚

扬子晚报 浏览 129

71岁TVB女星与老公,经历流产后决定不生育

TVB剧评社 浏览 205

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者 浏览 237

《生万物》大结局收官,三件事却令人意想不到!

电和影 浏览 412

智驾双雄:大湾区杀出全球智驾新势力

21世纪经济报道 浏览 166

伊朗驻华大使:美国若敢动伊朗 影响将远超各方控制

中国日报网 浏览 191

长城汽车取消大小周,员工感慨:工作11年,终于等到全面双休了

红星资本局 浏览 1231

U20世界杯4强出炉

体坛周报 浏览 235

9.78-11.48万元 荣威M7 DMH开启预售

网易汽车 浏览 360

信达生物与武田制药达成全球战略合作,交易额最高可达114亿美元,股价收跌近2%

红星资本局 浏览 1669

瓜帅:维拉一直是最难对付的对手;多库的1对1能力让他很特别

懂球帝 浏览 281
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4