排序
Gemini 1.5-谷歌发布的新一代AI大模型
Gemini 1.5是什么? Gemini 1.5是谷歌发布的全新AI大模型,除了性能显著增强,还在长上下文理解方面取得突破,它可以处理多达100万token,实现了迄今为止任何大型基础模型中最长的上下文窗口。...
Llama 3-Meta最新推出的新一代开源大模型
Llama 3是什么? Llama 3是一款由Meta推出的新一代开源人工智能大语言模型,Llama-3 包含 8B(80亿参数)、70B(700亿参数)两个版本,分为基础预训练和指令微调两种模型,还有一个超4000亿参数...
EMO-阿里巴巴发布的AI肖像视频生成框架
EMO是什么? EMO是一个由阿里巴巴发布的音频驱动的肖像视频生成框架。它能够通过单一参考图像和音频输入,生成具有丰富表情和多样头部姿势的虚拟角色视频。EMO利用先进的注意力机制和去噪网络,...
腾讯混元大模型
腾讯混元大模型是什么? 腾讯混元大模型(Tencent Hunyuan)是由腾讯研发的大语言模型,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。它可以持续训练和学习,覆...
火山方舟-一站式大模型服务平台
火山方舟是什么? 火山方舟是字节跳动旗下火山引擎推出的一站式AI大模型服务平台,该平台提供模型精调、推理、评测等全方位功能与服务,提供丰富的插件生态和AI原生应用开发服务,并通过安全可...
豆包大模型-字节跳动推出的系列大语言模型
豆包大模型是什么? 豆包大模型是字节跳动自研的一系列人工智能模型,包括通用模型Pro、Lite、角色扮演模型、语音合成模型、声音复刻模型、语音识别模型、文生图模型、Function Call模型和向量...
Imagen 3-谷歌推出的文生图模型,可生成高质量图像
Imagen 3是什么? Imagen 3 是 Google DeepMind 最新推出的文本到图像生成模型,它能够生成高质量、高分辨率的图像,具有更好的细节和丰富的光照效果。该模型支持多种视觉风格,从照片般逼真到...
Veo – Google推出的视频模型,可生成1分钟1080p视频
Veo是什么? Veo 是 Google DeepMind 开发的先进视频生成模型,能够生成1080p高分辨率、长时长的高质量视频。它支持广泛的电影和视觉风格,准确捕捉提示的细微差别,并提供创意控制。Veo 旨在使...
GPT-4o:OpenAI最新发布的多模态AI大模型,可实时推理音频、视觉和文本
GPT-4o是什么? GPT-4o是OpenAI推出的最新一代大型语言模型,它集合了文本、图片、视频、语音的全能模型,能够实时响应用户需求,并通过语音进行实时回答。GPT-4o具有强大的逻辑推理能力,其速...
讯飞星火认知大模型
讯飞星火认知大模型 讯飞星火认知大模型是科大讯飞研发的以中文为核心的新一代认知智能大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。 通过海量文本、代码和知...