中文羊驼大模型三期 v2.0
本次发布Llama-3-Chinese-8B-Instruct-v2(指令模型),直接采用500万条指令数据在Meta-Llama-3-8B-Instruct 上进行精调。
v1版(PT+SFT,基于非Instruct版训练)和v2版(SFT,基于Instruct版训练)各有特点,可根据下游任务效果、实际主观体验等方面选择。
下载方式
模型名称 | 完整版 | LoRA版 | GGUF版 |
---|---|---|---|
Llama-3-Chinese-8B-Instruct-v2 (指令模型) |
[🤗Hugging Face] [🤖ModelScope] [wisemodel] |
[🤗Hugging Face] [🤖ModelScope] [wisemodel] |
[🤗Hugging Face] [🤖ModelScope] |
客观任务效果
由于Llama-3-Chinese-8B-Instruct-v2使用的初始化模型为Meta-Llama-3-8B-Instruct(其效果比非Instruct版高),相关下游任务指标相比v1均有显著提升,部分指标上超过原版。以下是部分结果:
Llama-3-Chinese-8B-Instruct | Llama-3-Chinese-8B-Instruct-v2 | |
---|---|---|
C-Eval Valid | 49.3 / 51.5 | 51.6 / 51.6 |
C-Eval Test | 48.3 / 49.4 | 49.7 / 49.8 |
CMMLU Test | 49.7 / 51.5 | 51.8 / 52.4 |
MMLU Valid | 60.1 / 61.3 | 62.1 / 63.9 |
MMLU Test | 59.8 / 61.8 | 62.6 / 63.7 |
LongBench Average | 29.6 | 46.4 |
详细结果请参看:https://github.com/ymcui/Chinese-LLaMA-Alpaca-3?tab=readme-ov-file#模型效果
主观体验效果
稍后Llama-3-Chinese-8B-Instruct-v2将登陆大模型竞技场,届时将与其他模型PK效果。
注:初期票数较少,排名结果不稳定。