关闭广告

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

智东西2591人阅读

智东西
作者徐珊
编辑云鹏

智东西3月11日消息，近日微软和俄亥俄州立大学的研究人员发布论文，提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法，即模拟试错（STE）法，并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言，STE通过大模型的“想象力”来模拟使用工具的一些合理场景，从而尝试适配不同的大模型，随后从新的反馈中，获得反馈不断优化。

ToolBench实验结果显示，STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力，让Mistral-Instruct-7B实现了46.7%的性能提升，使其成绩超过了GPT-4。

版权与免责声明：本文内容转载自其他媒体，目的在于传递更多信息，不代表本网观点或立场，不承担此类作品侵权行为的自己责任及连带责任。

猜你喜欢

相关阅读

普京将以独立候选人身份竞选总统

国是直通车浏览 4433

达达“曝家丑”，京东受伤

雷达财经浏览 4003

俄专家称瓦格纳集团未来或有三种可能：不会彻底消亡

红星新闻浏览 41639

精彩推荐

曝吴孟达因病入院，田启文透露现在病情控制得不错

趣看热点浏览 17683

乌外长：俄乌谈判不能仅从停止敌对行动开始，乌拒绝“冻结冲突”

环球网资讯浏览 7575

巴菲特变了吗，说好的“买入并持有”呢？

大摩财经浏览 11278

塞总统：＂过去没有、将来也不会＂供乌武器和弹药

海外网浏览 10621

满脸雀斑也不妨碍她们当女神！

ChicMyGeek 浏览 10629

春日穿搭选韩系展现温柔的女性魅力

小红豆变美日记浏览 10828

郑冀峰被扒侵犯12岁女孩戏中＂七仙女＂有6个被他猥亵

素素娱乐浏览 122

商务部透露：我国汽车以旧换新提交补贴申请近2万份

智车情报局浏览 2289

字节大模型策略：自研加平台

晚点LatePost 浏览 6940

集度变极越，百度还造车吗？

刺猬公社浏览 6811

马克龙呼吁乌克兰盟友＂不做懦夫＂被德国防长批评

环球网资讯浏览 3766

美军遇重大伤亡拜登政府发声明:不寻求与伊朗开战

环球网资讯浏览 4038

继续进化！崔永熙砍下生涯首个25+10 命中5记三分为生涯新高

直播吧浏览 10961

把胖女孩做成手机壁纸，成减肥新方式

她刊浏览 4443

曲敏成二十大后黑龙江被查＂首虎＂ 7天前还曾参加会议

政知新媒体浏览 44845

官方:中国稀土没卖出"稀"的价格卖出了"土"的价格

澎湃新闻浏览 18896

雷军称小米汽车SU7尾标已修改感谢大家支持和关心

智车情报局浏览 3915

互联网大厂加码订购背后国产芯片仍缺生态加持

财联社浏览 5945

将主持《浪姐4》？李湘回应：不去感谢湖南卫视

网易娱乐浏览 11215

27%佣金惹众怒，苹果开年争议缠身

环球时报国际浏览 4771

杨元庆：DeepSeek出现加速混合式人工智能落地

澎湃新闻浏览 118

本站所有信息收集于互联网，如本站收集信息侵权，请联系我们及时删除
闽ICP备16027347号-4