HuggingFace工程师亲授:如何在Transformer中实现最好的位置编码
机器之心报道编辑:蛋酱一个有效的复杂系统总是从一个有效的简单系统演化而来的。——John Gall在 Transformer 模型中,位置编码(Positional Encoding) 被用来表示输入序列中的单词位置。与隐...
遗憾不?原来百度2017年就研究过Scaling Law,连Anthropic CEO灵感都来自百度
机器之心报道机器之心编辑部原来早在 2017 年,百度就进行过 Scaling Law 的相关研究,并且通过实证研究验证了深度学习模型的泛化误差和模型大小随着训练集规模的增长而呈现出可预测的幂律 scal...
陈天奇团队LLM结构化生成新引擎XGrammar:百倍加速、近零开销
机器之心报道编辑:Panda、杜伟现在,大语言模型的结构化生成有了一个更加高效、灵活的引擎。不管是编写和调试代码,还是通过函数调用来使用外部工具,又或是控制机器人,都免不了需要 LLM 生成...
吴恩达出手,开源最新Python包,一个接口调用OpenAI等模型
机器之心报道编辑:陈陈在构建应用程序时,与多个提供商集成很麻烦,现在 aisuite 给解决了。用相同的代码方式调用 OpenAI、Anthropic、Google 等发布的大模型,还能实现便捷的模型切换和对比测...
创业一年半,胖了30斤,AI大佬感叹:还是回谷歌好
机器之心报道编辑:蛋酱、泽南回到大厂,和老领导重聚。「由于工作强度和不健康的生活方式,我已胖了 15 公斤。」本周一,知名 AI 学者、前谷歌大脑高级研究科学家 Yi Tay 在短短一年半的创业之...
大模型已达上限?科技巨头开始“卷”AI智能体,机构:未来五年市场规模激增420亿美元
虽然像ChatGPT等大语言模型一直是AI新闻的焦点,但现在人们开始意识到它们的局限性。 最近,OpenAI表示,其旗舰GPT模型的改进速度正在放缓,这引发了业内对未来发展方向的疑问。Salesforce首席...
和梁朝伟同获港科荣誉博士,黄仁勋与沈向洋对谈Scaling Law、后训练、机器人和爱情
机器之心报道机器之心编辑部11 月 23 日,香港科技大学举行了今年度的学位颁授典礼。英伟达创始人和 CEO 黄仁勋又新增一个荣誉工程学博士头衔,与他一同获得荣誉博士学位的还有著名影星梁朝伟、...
文本、图像、点云任意模态输入,AI能够一键生成高质量CAD模型了
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要...
更新了!带Agent的Cursor太疯狂了
机器之心报道编辑:陈陈、小舟AI 辅助编程工具这条赛道越来越卷了。新晋 AI 编程神器 Cursor,终于迎来了一次备受关注的版本更新,Cursor 0.43 来了。新版本最大亮点之一是推出了 Composer Agen...
小学二年级数学水平,跟着这篇博客也能理解LLM运行原理
机器之心报道机器之心编辑部大家好,这是我们翻译的西瓜书平替。「小白学 AI 该从哪里下手?」去互联网上搜索一圈,最高赞的回复往往是高数起手,概率论也要学一学吧,再推荐一本大名鼎鼎的「西...