关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西2591人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

曝吴孟达因病入院,田启文透露现在病情控制得不错

趣看热点 浏览 17683

乌外长:俄乌谈判不能仅从停止敌对行动开始,乌拒绝“冻结冲突”

环球网资讯 浏览 7575

巴菲特变了吗,说好的“买入并持有”呢?

大摩财经 浏览 11278

塞总统:"过去没有、将来也不会"供乌武器和弹药

海外网 浏览 10621

满脸雀斑也不妨碍她们当女神!

ChicMyGeek 浏览 10629

春日穿搭选韩系 展现温柔的女性魅力

小红豆变美日记 浏览 10828

郑冀峰被扒侵犯12岁女孩 戏中"七仙女"有6个被他猥亵

素素娱乐 浏览 122

商务部透露:我国汽车以旧换新提交补贴申请近2万份

智车情报局 浏览 2289

字节大模型策略:自研加平台

晚点LatePost 浏览 6940

集度变极越,百度还造车吗?

刺猬公社 浏览 6811

马克龙呼吁乌克兰盟友"不做懦夫" 被德国防长批评

环球网资讯 浏览 3766

美军遇重大伤亡 拜登政府发声明:不寻求与伊朗开战

环球网资讯 浏览 4038

继续进化!崔永熙砍下生涯首个25+10 命中5记三分为生涯新高

直播吧 浏览 10961

把胖女孩做成手机壁纸,成减肥新方式

她刊 浏览 4443

曲敏成二十大后黑龙江被查"首虎" 7天前还曾参加会议

政知新媒体 浏览 44845

官方:中国稀土没卖出"稀"的价格 卖出了"土"的价格

澎湃新闻 浏览 18896

雷军称小米汽车SU7尾标已修改 感谢大家支持和关心

智车情报局 浏览 3915

互联网大厂加码订购背后 国产芯片仍缺生态加持

财联社 浏览 5945

将主持《浪姐4》?李湘回应:不去 感谢湖南卫视

网易娱乐 浏览 11215

27%佣金惹众怒,苹果开年争议缠身

环球时报国际 浏览 4771

杨元庆:DeepSeek出现加速混合式人工智能落地

澎湃新闻 浏览 118
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
闽ICP备16027347号-4