排序
Token化一切,甚至网络!北大&谷歌&马普所提出TokenFormer,Transformer从来没有这么灵活过!
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要...
大模型不会推理,为什么也能有思路?有人把原理搞明白了
机器之心报道编辑:泽南、杜伟大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理,在今年 6 月,一篇 Nature 论文《Langu...
全球十亿级轨迹点驱动,首个轨迹基础大模型来了
机器之心报道机器之心编辑部在智慧城市和大数据时代背景下,人类轨迹数据的分析对于交通优化、城市管理、物流配送等关键领域具有重要意义。然而,现有的轨迹相关模型往往受限于特定任务、区域依...
再投40亿美元!亚马逊向OpenAI劲敌Anthropic追加投资
机器之心报道机器之心编辑部在各大科技公司纷纷竞相资助生成式 AI 之际,亚马逊正向 AI 初创公司 Anthropic 额外投资 40 亿美元。这将使亚马逊对 Anthropic 的总投资(自去年开始)达到 80 亿美...
Scaling Laws终结,量化无用,AI大佬都在审视这篇论文
研究表明,你训练的 token 越多,你需要的精度就越高。 最近几天,AI 社区都在讨论同一篇论文。 UCSD 助理教授 Dan Fu 说它指明了大模型量化的方向。 CMU 教授 Tim Dettmers 则直接说...
ByteDance Research登Nature子刊:AI+冷冻电镜,揭示蛋白质动态
机器之心发布机器之心编辑部2024 年的诺贝尔化学奖颁发给了在结构生物学领域取得重大成就的 David Baker 团队和 AlphaFold 团队,激发了 AI for science 领域新的研究热潮。近两年科学界一个饱...
揭示Transformer重要缺陷!北大提出傅里叶分析神经网络FAN,填补周期性特征建模缺陷
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要...
扩展测试时计算是万能的吗?Scaling What成为关键
机器之心PRO · 会员通讯 Week 46---- 本周为您解读 ③ 个值得细品的 AI & Robotics 业内要事 ----1. 扩展测试时计算是万能的吗?Scaling What成为关键传统的 Scaling Laws ...
12%计算量就能媲美原模型,Adobe、罗切斯特大学等提出YOPO剪枝技术
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要...
一句话爆改三维场景!斯坦福吴佳俊团队新作:场景语言,智能补全文本到3D的场景理解
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要...