这才是真・开源模型!公开「后训练」一切,性能超越Llama 3.1 Instruct
机器之心报道编辑:Panda、张倩开源模型阵营又迎来一员猛将:Tülu 3。它来自艾伦人工智能研究所(Ai2),目前包含 8B 和 70B 两个版本(未来还会有 405B 版本),并且其性能超过了 Llama 3.1 I...
再投40亿美元!亚马逊向OpenAI劲敌Anthropic追加投资
机器之心报道机器之心编辑部在各大科技公司纷纷竞相资助生成式 AI 之际,亚马逊正向 AI 初创公司 Anthropic 额外投资 40 亿美元。这将使亚马逊对 Anthropic 的总投资(自去年开始)达到 80 亿美...
阿里国际版o1来了,Marco-o1:聚焦开放式问题推理
机器之心报道机器之心编辑部自从 OpenAI 发布 o1 模型以来,业界对其的追赶不断加速。大模型推理的一个关键挑战在于,现实世界常常提出很多开放式和创造性的问题,对于 AI 来说,这是一类很难评...
英伟达开源福利:视频生成、机器人都能用的SOTA tokenizer
机器之心报道编辑:张倩tokenizer对于图像、视频生成的重要性值得重视。在讨论图像、视频生成模型时,人们的焦点更多地集中在模型所采用的架构,比如大名鼎鼎的 DiT。但其实,tokenizer 也是非...
NeurIPS 2024 Oral | 还原所见!揭秘从脑信号重建高保真流畅视频
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要...
大模型不会推理,为什么也能有思路?有人把原理搞明白了
机器之心报道编辑:泽南、杜伟大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理,在今年 6 月,一篇 Nature 论文《Langu...
上交大o1复现新突破:蒸馏超越原版,警示AI研发"捷径陷阱"
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要...
全球十亿级轨迹点驱动,首个轨迹基础大模型来了
机器之心报道机器之心编辑部在智慧城市和大数据时代背景下,人类轨迹数据的分析对于交通优化、城市管理、物流配送等关键领域具有重要意义。然而,现有的轨迹相关模型往往受限于特定任务、区域依...
仅仅一天,Gemini就夺回了GPT-4o拿走的头名
机器之心报道编辑:蛋酱、陈陈太卷了,大模型迭代开始以「周」为单位了吗?一周前,谷歌的 Gemini-Exp-1114 模型取代 GPT-4o,坐上了 Arena 榜单的头把交椅。对于苦苦追赶 OpenAI 几个月的谷歌...
如今的智能体,已经像人一样「浏览」视频了,国内就有
机器之心发布机器之心编辑部当你正在观看一部紧张刺激的动作电影,忽然好奇:“那个角色到底是在哪一集说的那句话?”“这里的背景音乐是什么?”又或者在一场足球比赛中,你错过了那个决定性的...