关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西2768人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

意游泳名将涉嫌在新加坡偷窃被捕 外交部长紧急介入

极目新闻 浏览 38

哈斯勒姆:科比不想和任何人做朋友 扶起对手不是曼巴精神

直播吧 浏览 43

试试多巴胺妆容,做自己的夏日小彩虹

Kevin老师 浏览 7189

今天,“港股实名制”落地!

中国基金报 浏览 11971

境外网友发图称福建舰甲板裂缝 美智库驳斥

环球网资讯 浏览 7491

这才是优雅女人的穿衣“典范”!外套厚实、裤子挺阔,太高级

静儿时尚达人 浏览 4555

北约秘书长要求北约各国军工增产备战

财联社 浏览 3984

买包的尽头是帆布包?她花几十块拿下女明星同款

黎贝卡的异想世界 浏览 115

潘多拉关店要超百家?网红轻奢品怎么不好卖了?

江瀚视野 浏览 749

全新马自达CX-5实车曝光:更大、更精致,动力也将升级

大李说车 浏览 150

是否会增加轮换?老里:不会 但若有需要 队员们都随时做好了准备

直播吧 浏览 10020

布林肯再次对胡塞武装放“狠话”

环球网资讯 浏览 4136

兴业银行异常涨停操盘者:系福建省属国企,此前已持有该行2.8%股份

澎湃新闻 浏览 5391

美俄闭门会谈四个小时,泽连斯基被关门外

浏览 279

医学专家警告:到2050年,抗生素耐药或导致每年1000万人死亡

网易科技报道 浏览 3947

头皮分泌油脂过多?建议尝试这5种改善方法

医说健康 浏览 9942

程前向周鸿祎道歉:失态失礼,回头看自己都觉得不可原谅

网易科技频道 浏览 4155

外交部:如加方不听劝告 中方必将坚决有力回击

环球网 浏览 70444

盒马换个活法

光子星球 浏览 64

夏天的经典单品,“t恤”原来这么百搭,40岁女人也能凹造型

静儿时尚达人 浏览 2130

天岳先进在港交所上市,创始人是“济南前首富”

红星资本局 浏览 497
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4