新闻中心
杏彩体育面壁智能亮相 WAIC 2024:发布开源大模型APP神器MobileC
杏彩平台官网7月5日,面壁智能联合创始人杏彩体育、首席科学家刘知远在WAIC 2024 “模型即服务(Mass)加速大模型应用落地”论坛进行了《大模型时代的摩尔定律,迈入更高效的大模型时代》主题演讲,并首次对外介绍:
演讲开场,刘知远表示:“摩尔定律揭示了集成电路可容纳晶体管数目约每隔18个月便会增加一倍的规律,在过去几十年中给半导体和互联网行业的发展带来了科学指导意义;身处大模型时代,我们亟需新的“摩尔定律”。我们根据过去几年在大模型领域的深耕和实践,对大模型的发展趋势进行观察总结,提出了大模型时代的面壁定律:大模型的知识密度不断提升,平均每8个月提升一倍。”
答案是否定的,面壁持续优化 Scaling Law,使得模型知识密度不断提升,不断训练出计算更加高效且表现更强(参数规模降低,数值位宽降低,结构更加高效)的基础大模型。
这背后,稀疏激活是大脑得以实现低能耗的一大核心“技术”,通过不同任务调取不同⼤脑分区神经元,能源与时间消耗⼤⼤降低。
和大脑类似,采用稀疏激活也能够在同等参数下减少大模型的推理能耗——稀疏度越高,每个词元(token)激活的神经元越少,大模型的推理成本和能耗就越少。
MiniCPM-S 1.2B采用了高度稀疏架构,通过将激活函数替换为ReLU及通过带渐进约束的稀疏感知训练 ,巧妙地解决了此前主流大模型在稀疏激活上面临的困境。和同规模的稠密模型MiniCPM 1.2B相比,MiniCPM-S 1.2具备:
•Sparse-高稀疏低能耗:在FFN层实现了高达87.89%平均稀疏度,推理算力下降84%;
•Speed-神仙推理: 更少计算,迅疾响应。纯 CPU 环境下,结合Powerinfer推理框架,推理解码速度提升约 2.8 倍;
这是对面壁定律的又一次验证且在时间上进行了加速!面壁“高效 Scaling Law” 仍在持续演绎。
面壁智能最新开源业内首个端侧大模型工具集MobileCPM,帮助开发者一键集成大模型到APP。MobileCPM 开箱即用,包含了开源端侧大模型、SDK开发套件以及翻译、摘要等丰富的 intent ,人人都可以一站式灵活地定制出满足不同应用场景需求的大模型 APP,低门槛速成「大模型创业者」!
•基础模式:包含了丰富的适配端侧⼤模型 APP 的 SDK 套件发者基于此即可⾃由灵活地搭建⼤模型 APP,但在这个过程中,基座模型和智能体仍需要开发者⾃⾏开发和接⼊;
•精装模式:在基础模式基础上,提供 1.2B 参数的⾯壁新⼀代⾼效稀疏⼤模型 MiniCPM-S,并且MobileCPM 还支持任意端侧模型的集成,开发者可以根据具体需求选择替换端侧模型,并可以通过增加或修改prompt的方式定制多种API,满足不同业务场景需求。
•全包配件模式:在精装模式的基础上预装丰富的 intent,并提供保姆式教程,开发者也可使用自定义 intent,减少开发时间,⼤幅提升应⽤的丰富性。
本次发布,MobileCPM 默认集成了面壁新一代高效稀疏架构模型 MiniCPM-S 1.2B ,一次性将智能密度拉满,更兼具:
•毫秒极速响应:得益于面壁小钢炮MiniCPM系列背后的高效大模型训练和推理工厂,MiniCPM-S 能够在毫秒级时间内完成推理和响应,确保用户体验的流畅性。
•零推理成本:无需云端 GPU,MiniCPM-S 专为端侧设备而生,在保证性能强大的同时大幅降低了计算资源的消耗,使得端侧推理几乎0成本杏彩体育。
MobileCPM 拉开了端侧AI生态序幕,基于MobileCPM,任何开发者都可以轻松打造自己的 SuperAPP,有效解决推理成本问题。PC和智能手机时代,所有原有的应用都值得用高效端侧模型尝试一遍!
AIGC大模型工场已经组织了非常精准的「AI大模型垂直社群」,覆盖超1000位AIGC圈,百度大模型业务负责人,京东大模型业务负责人,腾讯大模型业务人,阿里云大模型技术负责人,科大讯飞大模型公关,商汤大模型业务,阅文大模型公关,360大模型公关负责人都在群里啦,欢迎大模型业务负责人加入。请加微信fqq2000nian ,注明真实身份。