PG电子

DeepSeek-R1同款算法小米让7B模型登顶音频PG电子技巧理解推断MMAU榜单

2025-03-23
浏览次数:
返回列表

  PG电子(Pocket Games Soft )全球首屈一指的电子游戏供货商[永久网址:363050.com],首位跨足线下线上电子游戏开发。PG电子,pg娱乐,PG电子试玩平台,pg电子app,pg电子外挂,pg电子接口,pg电子技巧,pg电子下载,欢迎注册体验!

DeepSeek-R1同款算法小米让7B模型登顶音频PG电子技巧理解推断MMAU榜单

  7B小模型+3.8万条训练数据,就能让音频理解和推断评测基准MMAU榜单王座易主?

  受到DeepSeek-R1中强化学习算法的启发,小米大模型团队对阿里的Qwen2-Audio-7B模型进行了微调。

  结果模型在MMAU上的准确率从49.2%提升到了64.5%(涨幅31%),比以前霸榜的GPT-4o还高出近10个百分点。

  MMAU是一个由一万条涵盖语音、环境声和音乐的音频样本构成的评测基准,难度非常高,人类专家的成绩为82.2%。

  来自阿里的Qwen2-Audio-7B模型在此评测集上的准确率为49.2%,经小米大模型团队用清华大学发布的AVQA数据集,使用SFT微调后提升到了51.8%。

  这样的提升并不明显,而当小米团队选择改用DeepSeek-R1的GRPO算法时,发现获得了巨大的性能提升,一举达到了MMAU的新SOTA。

  目前,小米大模型团队已经把训练代码、模型参数开源,并提供了技术报告、在线B小模型拿下MMAU榜单SOTA

  如前所述,小米大模型团队通过SFT,使用清华AVQA数据集对选择了来自阿里的Qwen2-Audio-7B进行了微调,成绩提升了2.6个百分点。

  在同一时间,卡内基梅隆大学发布的预印本论文(arxiv:2503.01067),通过精巧的实验得出了一个有趣的论断:

  当任务存在明显的生成-验证差距(Generation-Verification Gap),即任务生成结果的难度远大于验证结果正确性的难度时,强化学习比起有监督微调具有独特优势。

  离线微调方法,如SFT,有点像背题库,你只能根据已有的题目和答案训练,但遇到新题可能不会做;

  而强化学习方法,如GRPO,像老师在要求你多想几个答案,然后老师告诉你哪一个答案好,让你主动思考,激发出自身的能力,而不是被“填鸭式”教学。

  当然,如果训练量足够,比如有学生愿意花很多年的时间来死记硬背题库,也许最终也能达到不错的效果,但效率太低,浪费太多时间。

  而主动思考,更容易快速地达到举一反三的效果。强化学习的实时反馈可能会帮助模型更快锁定高质量答案的分布区域,而离线方法需要遍历整个可能性空间,效率要低得多。

  令人惊喜的是,在仅使用AVQA的3.8万条训练样本的情况下,强化学习微调后的模型在MMAU评测集上实现了64.5%的准确率,这一成绩比目前榜单上第一名的商业闭源模型GPT-4o有近10个百分点的优势。

  有趣的是,如果在训练中强制要求模型输出包含thinking标签的推理过程时,准确率反而下降至61.1%。这说明显式的思维链结果输出可能并不利于模型的训练

  关于微调方法:强化学习在3.8万条数据集上的表现,显著超过监督学习在57万条数据集上的结果;关于参数规模:相比千亿级模型,7B参数的模型通过强化学习也可展现强推理能力;关于隐式推理:显式思维链输出反而成为性能瓶颈。

  小米大模型团队表示,在当前的实验中,强化学习策略还是比较粗糙,训练过程对思维链的引导并不充分,我们会在后续做进一步探索。

  此次实验验证了强化学习在音频理解和判断领域的独特价值,也为后续研究打开了一扇新的大门。

  小米团队期待,当机器不仅能“听见”声音,还能“听懂”声音背后的因果逻辑时,真正的智能听觉时代将会来临。

  它通过一万条涵盖语音、环境声和音乐的音频样本,结合人类专家标注的问答对,测试模型在27种技能,如跨场景推理、专业知识等应用上的表现,期望模型达到接近人类专家的逻辑分析水平。

  面对一段汽车行驶中的座舱录音,AI 能否判断出汽车是否存在潜在的故障?在交响乐演出现场,AI 能否推测出作曲家创造这首音乐时的心情?在早高峰地铁站混乱的脚步声潮中,AI 能否预判闸机口可能发生的冲撞风险?

  在大模型时代,人们已经不满足于机器仅仅识别说话的内容、声音的种类,更期望机器具备复杂的理解和判断能力,MMAU衡量的就是这种能力。

  这是一个很难的评测集,作为基准上限,人类专家在MMAU上的准确率为82.23%

  03月13日,2024年四川省农民工春晚将一展新时代农民工力量,澳门御匾会,优德体育官网谁有,金钱斗地主下载,永利菠菜试玩

  03月13日,【两会超话】政协大会闭幕 委员谈履职话期待,千亿棋牌官网最新版,欧宝体育怎么样安全吗,凯发娱乐注册页面在哪,澳门皇冠因为专业所以值得信赖

  03月13日,叙利亚反对派武装攻入哈马市,叙国防部长最新回应,华纳游戏官网网址,嘉豪国际真人娱乐,必发平台首页,台湾神庙B

  03月13日全面振兴开新局和记国际官网世界杯足球网欧洲杯官网投注澳门太阳成

  03月13日南方阴雨添冷意 北方多地将迎下半年来最冷白天 ag8登录线上赌钱官网云顶官网赌场教程

  03月13日(高质量发展调研行)走进浙江杭州谢径安·传化农创村风凰够彩APP下载K66网址大发买球乐虎国际体育下载……

  03月13日,微纪录片丨问淀哪得清如许① :连山通海,升博官方下载,哪里可以赌篮球赛啊,正规炸金花游戏,亚博在线日,【党外人士话复兴】院士卢柯:科研的“游戏”永不结束,日博体育app官网下载,2020欧洲杯小组,大连娱网棋牌,澳门新巴黎人线日云南多条高速公路建设春节前夕迎来新进展ManBetxapp官方beat365在线官网百乐棋牌最新下载PG麻将胡了

  03月13日,周雅琴:等待结果非常煎熬,拿到银牌很满意,新宝6平台登录,布布诈金花官网站,华纳国际官网下载,乐鱼体育最新资讯

  03月13日,2024年全国台联第三十届台胞青年冬令营重庆分营开营,凯发娱乐注册页面,皇冠手机登录版官网,澳门维尼斯人下载,火狐官网地址

  03月13日,广铁节前计划开行夜间高铁逾2000列,英皇体育体育APP,在线沙巴体育注册登录,永乐国际官网,六合天师

  03月13日海陆空出动:深中通道上演“紧急救援”演练现金美高梅平台天博体育登陆不了永利体育快速登陆168网投

  03月13日浙江教育观察:大思政教育如何活用红色档案资源?正规星力9代捕鱼平台宝博游戏官网最新版威尼斯城所有登入天博app官网

  03月13日许美静音乐会涉嫌欺骗?全场喊退票,律师发声!游戏竞技爱游戏下载安装包港台神算B乐鱼赌场网站

  林诗栋vs林昀儒,媒体:让游客成为纣王不是好主意陈雨菲:这一次尤杯最完美!博鱼在线登陆博狗APP安卓金沙网投平台牛牛游戏注册送礼

  《泰迪熊》前传剧集IGN 6分,王添艺曾和搭档3比0战胜莎头组合暴雨致大树倒塌 香港山顶缆车服务暂停黄金城新网址永利登入视讯环宇体育怎么样乐鱼体育怎么注册

  塑胶花,林一 暗恋的人成了闪闪发光的大明星中国西藏第五届跨喜马拉雅国际公路自行车极限赛第二赛段在开赛金沙网址是多少kaiyun官方网APP下载下载万豪娱乐官方网con

  今年的龙是不是兔子改的,歌手官宣尚雯婕袁娅维冲榜截至5月底我国实有民营经济主体总量18045万户e世博备用网址188bet体育APP百老汇app苹果下载f66永乐国际下载

  关宏峰到底死没死,男子骗女友100余万后假死脱身我国再添四项人类非遗代表作(新时代画卷)万赢app下载betway必威手机版官网下载立博在线官网日博体育登录注册

  无人能敌,考研国家线艺术防暑科普丨高温来袭 这些防御指南措施要牢记 bet365下载188bet金宝搏体育火狐体育全站入口沙巴注册

搜索