排序
WHALE来了,南大周志华团队做出更强泛化的世界模型
机器之心报道作者:陈陈、佳琪世界模型又出新进展了,来自国内机构。人类能够在脑海中设想一个想象中的世界,以预测不同的动作可能导致不同的结果。受人类智能这一方面的启发,世界模型被设计用...
大模型承重墙,去掉了就开始摆烂!苹果给出了「超级权重」
机器之心报道编辑:蛋酱、佳琪去掉一个「超权重」的影响,比去掉其他 7000 个离群值权重加起来还要严重。大模型的参数量越来越大,越来越聪明,但它们也越来越奇怪了。两年前,有研究者发现了一...
吴恩达出手,开源最新Python包,一个接口调用OpenAI等模型
机器之心报道编辑:陈陈在构建应用程序时,与多个提供商集成很麻烦,现在 aisuite 给解决了。用相同的代码方式调用 OpenAI、Anthropic、Google 等发布的大模型,还能实现便捷的模型切换和对比测...
NeurIPS 2024 Spotlight | 如何操纵时间序列预测结果?BackTime:全新的时间序列后门攻击范式
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要...
仅仅一天,Gemini就夺回了GPT-4o拿走的头名
机器之心报道编辑:蛋酱、陈陈太卷了,大模型迭代开始以「周」为单位了吗?一周前,谷歌的 Gemini-Exp-1114 模型取代 GPT-4o,坐上了 Arena 榜单的头把交椅。对于苦苦追赶 OpenAI 几个月的谷歌...
流式深度学习终于奏效了!强化学习之父Richard Sutton力荐
机器之心报道机器之心编辑部自然智能(Natural intelligence)过程就像一条连续的流,可以实时地感知、行动和学习。流式学习是 Q 学习和 TD 等经典强化学习 (RL) 算法的运作方式,它通过使用最...
LoRA、完全微调到底有何不同?MIT 21页论文讲明白了
机器之心报道编辑:陈陈、小舟本文旨在了解两种微调大型语言模型方法之间的差异:完全微调和低秩自适应 (LoRA)。这两种方法都用于将预训练模型适应特定的下游任务,但它们却有所不同。微调(Fin...
从未见过现实世界数据,MIT在虚拟环境中训练出机器狗,照样能跑酷
机器之心报道编辑:杜伟如今,机器人学习最大的瓶颈是缺乏数据。与图片和文字相比,机器人的学习数据非常稀少。目前机器人学科的主流方向是通过扩大真实世界中的数据收集来尝试实现通用具身智能...
研究大模型门槛太高?不妨看看小模型SLM,知识点都在这
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要...
首个多模态连续学习综述,港中文、清华、UIC联合发布
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要...