排序
遗憾不?原来百度2017年就研究过Scaling Law,连Anthropic CEO灵感都来自百度
机器之心报道机器之心编辑部原来早在 2017 年,百度就进行过 Scaling Law 的相关研究,并且通过实证研究验证了深度学习模型的泛化误差和模型大小随着训练集规模的增长而呈现出可预测的幂律 scal...
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
机器之心报道机器之心编辑部在当今多模态领域,CLIP 模型凭借其卓越的视觉与文本对齐能力,推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习,将视觉与语言信号嵌入到同一特征空间...
国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了
机器之心原创编辑:杜伟、泽南没想到,技术发展得竟然这么快。最近,人们已经开始畅想 AI 时代后的生活了。上周末,摩根大通 CEO 杰米・戴蒙(Jamie Dimon)表示,由于人工智能技术,未来几代人...
HuggingFace工程师亲授:如何在Transformer中实现最好的位置编码
机器之心报道编辑:蛋酱一个有效的复杂系统总是从一个有效的简单系统演化而来的。——John Gall在 Transformer 模型中,位置编码(Positional Encoding) 被用来表示输入序列中的单词位置。与隐...
创业一年半,胖了30斤,AI大佬感叹:还是回谷歌好
机器之心报道编辑:蛋酱、泽南回到大厂,和老领导重聚。「由于工作强度和不健康的生活方式,我已胖了 15 公斤。」本周一,知名 AI 学者、前谷歌大脑高级研究科学家 Yi Tay 在短短一年半的创业之...
陈天奇团队LLM结构化生成新引擎XGrammar:百倍加速、近零开销
机器之心报道编辑:Panda、杜伟现在,大语言模型的结构化生成有了一个更加高效、灵活的引擎。不管是编写和调试代码,还是通过函数调用来使用外部工具,又或是控制机器人,都免不了需要 LLM 生成...
吴恩达出手,开源最新Python包,一个接口调用OpenAI等模型
机器之心报道编辑:陈陈在构建应用程序时,与多个提供商集成很麻烦,现在 aisuite 给解决了。用相同的代码方式调用 OpenAI、Anthropic、Google 等发布的大模型,还能实现便捷的模型切换和对比测...
智能体竟能自行组建通信网络,还能自创协议提升通信效率
机器之心报道编辑:PandaHugging Face 上的模型数量已经超过了 100 万。但是几乎每个模型都是孤立的,难以与其它模型沟通。尽管有些研究者甚至娱乐播主试过让 LLM 互相交流,但所用的方法大都比...
更新了!带Agent的Cursor太疯狂了
机器之心报道编辑:陈陈、小舟AI 辅助编程工具这条赛道越来越卷了。新晋 AI 编程神器 Cursor,终于迎来了一次备受关注的版本更新,Cursor 0.43 来了。新版本最大亮点之一是推出了 Composer Agen...
小学二年级数学水平,跟着这篇博客也能理解LLM运行原理
机器之心报道机器之心编辑部大家好,这是我们翻译的西瓜书平替。「小白学 AI 该从哪里下手?」去互联网上搜索一圈,最高赞的回复往往是高数起手,概率论也要学一学吧,再推荐一本大名鼎鼎的「西...