Mistral发布Large2挑战Llama31

Mistral发布Large2挑战Llama31-3

法国人工智能初创公司Mistral推出新一代开源模型Mistral Large 2,以1230亿参数挑战行业巨头,尽管其参数数量少于Meta的Llama 3.1,但性能却与之媲美,引发业界广泛关注。

在全球人工智能领域,竞争正以前所未有的速度加速。继Meta公司推出其开源Llama 3.1模型之后,法国初创公司Mistral也不甘示弱,宣布了其旗舰开源模型的新一代产品——Mistral Large 2,拥有1230亿个参数,尽管数量上不及Llama 3.1的4050亿,但性能上却与之不相上下。

Mistral Large 2它在原有Large模型的基础上进行了升级,增强了多语言能力,并在推理、代码生成和数学方面的表现得到了显著提升。这款模型被认为达到了GPT-4级别的性能,与GPT-4o、Llama 3.1-405和Anthropic的Claude 3.5 Sonnet在多个基准测试中的表现不相上下。

Mistral发布Large2挑战Llama31-4

Mistral Large 2的推出,标志着该公司在人工智能领域的雄心壮志。该模型虽然仅对非商业研究用途开放许可,但已允许第三方根据需要进行定制,这一策略在业界引起了不小的震动。对于那些寻求商业或企业级应用的用户,Mistral提供了单独的许可证和使用协议。

Mistral Large 2的升级,不仅在多语言能力上得到了显著提升,还在推理、代码生成和数学方面展现了其强大的性能。公司强调,这款产品在提供新特性的同时,继续推动成本效率、速度和性能的极限,帮助用户构建高性能的人工智能应用。

值得注意的是,Mistral Large 2的上下文窗口增至128,000个标记,与OpenAI的GPT-4o和Meta的Llama 3.1相匹配,支持包括英语、法语、西班牙语、德语、意大利语、葡萄牙语、阿拉伯语、印地语、俄语、中文、日语和韩语在内的数十种语言。

Mistral发布Large2挑战Llama31-5

Mistral表示,这款通用模型非常适合需要强大推理能力或高度专业化的任务,例如合成文本生成、代码生成或RAG。

在性能测试方面,Mistral Large 2在多语言MMLU基准测试中与Meta的Llama 3.1-405B表现相当,并且在成本效益上更具优势。此外,新模型在编码任务上也取得了显著进步,能够以极高准确度生成80多种编程语言的代码。

Mistral还特别强调了模型在指令遵循和最小化幻觉方面的改进,确保了在回答问题时的谨慎性和选择性,以及在企业环境中提供简洁明了答案的能力。

目前,Mistral Large 2已经通过公司的API端点平台以及Google Vertex AI、Amazon Bedrock、Azure AI Studio和IBM WatsonX等云平台向用户开放,用户可以通过公司的聊天机器人来测试其在现实世界中的应用效果。Mistral的这一举措,无疑为人工智能领域带来了新的活力和竞争。

THE END
分享
二维码
< <上一篇
下一篇>>