关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西2952人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

因1.4万元,这家造车新势力成“老赖”,董事长被限制高消费

每日经济新闻 浏览 7028

绝境看梅西!8天两进决赛创多项纪录,冲击前无古人第45冠

ALL体育 浏览 6285

现场:马竞绝杀国米6连胜!甘当替补的格子同样出色

体坛周报 浏览 22

图片报:赫内斯、图赫尔等人在拜仁引援会议上讨论了金玟哉

直播吧 浏览 7917

BIO-FORUM 2025 蓄势待发|聚焦生物医药前沿技术,共建全球创新合作生态

上观新闻 浏览 59

20万级新能源MPV,传祺E8能不能叫同级中的新卷王?

Autolab 浏览 4453

E句话| 他们都离婚了?

仙女事件簿 浏览 80

上映17天,《浪浪山小妖怪》丢了冠军,成龙新片破2.5亿夺第一

靠谱电影君 浏览 196

他靠演反派爆火却对同事女儿一见钟情

张发林 浏览 160

夏季100套好看显瘦的泳衣造型 看完就出发去海边

In风尚 浏览 6536

港媒曝谢霆锋长子疑似情窦初开,携异性澳洲逛街

扒虾侃娱 浏览 6246

别再尬演角色黑化了 演技不够眼妆来凑?

置身事内 浏览 11036

香港男子在宏福苑大火中失去母亲和弟弟:撑不下去了

极目新闻 浏览 8

德约纪念逝去恩师忍不住落泪,现场打脸意大利网协主席

网球之家 浏览 53

比塞克:国米负责人已经看了我的比赛 我在任何球队都能竞争

直播吧 浏览 7168

茅台,泸州老窖,开始像房地产“去库存”

说财猫 浏览 4791

吊打内娱的阴湿女王,回来了

独立鱼 浏览 76

京东造车!刘强东有新玩法?

百姓评车 浏览 109

拜登:越南邀我访问 还想将关系提升为与中国同等地位

北京日报客户端 浏览 38418

机器人企业为何扎堆“跑向”港股?

国是直通车 浏览 10219

世体:巴萨20岁前锋阿拉孔将跟随弗里克参加美国季前赛

直播吧 浏览 2308
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4