面壁智能发布新一代基座模型MiniCPM 3.0
- 公司背景:面壁智能是一家中国大模型公司,专注于开发端侧AI模型。
- 产品发布:面壁智能发布了新一代基座模型MiniCPM 3.0,这是一个4B参数的小模型,但其性能据称超越了千亿参数级别的GPT-3.5。
MiniCPM 3.0的特点:
- 综合性能:在自然语言理解、知识、代码、数学等多项能力上超越了GPT-3.5。
- 长文本处理:具有无限长文本处理能力,性能超越了Kimi,即使在超长文本上也能保持稳定。
- Function Calling:在Function Calling方向上,性能接近GPT-4o,是端侧模型中的佼佼者。
- RAG技术:结合了RAG(检索增强生成技术),在中文检索和内容生成方面表现出色。
技术架构:
- 面壁智能采用了LLMxMapReduce长文本分帧处理技术,实现了无限长文本处理。
- MiniCPM 3.0在多个评测集上取得了优异的成绩,包括InfiniteBench和Berkeley Function-Calling Leaderboard。
开源地址:
- GitHub: https://github.com/OpenBMB/MiniCPM
- HuggingFace: https://huggingface.co/openbmb/MiniCPM3-4B
未来目标:
- 面壁智能计划在未来两年内,将性能相当于GPT-4的大模型运行在手机上。
文章强调了面壁智能在端侧AI领域的创新和领先地位,以及MiniCPM 3.0在多个AI技术方向上取得的突破。如果您对MiniCPM 3.0或面壁智能有更具体的问题或需要更多信息,请告诉我,我会尽力帮助您。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
走过万里,足下留香...