维其互联 > 信息聚合 > 面壁智能推出 MiniCPM-Llama3-V 2.5 开源端侧多模态模型:8B 参…

面壁智能推出 MiniCPM-Llama3-V 2.5 开源端侧多模态模型:8B 参…

2024-05-21 16:07:14来源: IT之家

IT之家 5 月 21 日消息,面壁智能昨晚推出并开源 MiniCPM 系列最新的端侧多模态模型 MiniCPM-Llama3-V 2.5,支持 30+ 种语言,宣称可实现:最强端侧多模态综合性能:超越 Gemini Pro 、GPT-4VOCR 能力 SOTA(IT之家注:State-of-the-Art):9 倍像素更清晰,难图长图长文本精准识别图像编码快 150 倍:首次端侧系统级多模态加速▲ OpenCompass 模型量级对比MiniCPM-Llama3-V 2.5 总参数量为 8B,多模态综合性能超越 GPT-4V-1106、Gemini Pro、Claude 3、Qwen-VL-Max 等商用闭源模型,OCR 能力及指令跟随能力得到进一步提升,可精准识别难图、长图、长文本,并支持超过 30 种语言的多模态交互。▲ 官方测试结果在 OpenCompass 测试中,MiniCPM-Llama3-V

标签: 开源
免费发布分类信息