Meta指出Llama 3 8B版本在MMLU、GPQA、HumanEval、GSM-8K或MATH等基準測試上,大幅勝出Google Gemma 7B-it及Mistral AI Mistral 7B Instruct這二款開源模型