语鲸大模型-深言科技推出的开源中英双语大语言模型-龙跃AI

AIHub 最新消息 2024年12月26日，深言科技“语鲸大模型”正式通过《生成式人工智能服务管理暂行办法》备案，将陆续面向社会公众开放服务。那么语鲸大模型是什么，可以做什么，如何使用呢，一起来看看。

语鲸大模型是什么？

LingoWhale-8B是由深言科技推出的语鲸系列大模型中首个开源的中英双语大语言模型，拥有约80亿参数，在数万亿token的高质量中英数据上进行预训练，具有强大的基础能力，在多个公开评测基准上均达到领先效果。在预训练阶段，模型使用8K的上下文长度进行训练，能够完成更长上下文的理解和生成任务。

“语鲸大模型”具备强大的语义理解与文本生成、代码理解与生成、逻辑推理等能力，提供文本创作、数学计算、代码补全等服务，在中文理解和生成能力上行业领先，做到了更懂中文，更懂中文使用场景。

以下是深言科技提供的测试样例：

语鲸大模型在各种公开评测基准上进行了测试，比如 C-Eval、MMLU 和 CMMLU。这些评估基准提供了标准化的测试和度量，用于评估语言模型在不同任务和领域上的性能和能力。

语鲸大模型在多个公开评测基准上取得了领先效果。评测方法和测评结果如下表所示：

Model	C-Eval	MMLU	CMMLU	GAOKAO	HumanEval	GSM8K	BBH	AGIEval
	5-shot	5-shot	5-shot	5-shot	0-shot	8-shot	3-shot	5-shot
GPT-4	68.4	83.9	70.3	66.2	69.5	90.0	75.1	63.3
GPT-3.5 Turbo	51.1	68.5	54.1	47.1	52.4	57.8	61.6	46.1
LLaMA2-7B	28.9	45.7	31.4	26.0	12.8	16.2	39.2	26.5
ChatGLM2-6B*	51.7	47.9	–	–	–	32.4	33.7	–
Baichuan2-7B-Base*	54.0	54.2	57.1	47.5	18.3	24.5	41.6	42.7
Qwen-7B v1.1*	63.5	58.2	62.2	–	29.9	51.7	45.0	–
LingoWhale-8B-base	63.6	60.2	62.8	50.3	32.9	55.0	47.5	43.8