2023年年初还在密集公示大模型研发进展的企业们,现正调整方向,选择直接接入大公司搭建的大模型平台。
6月28日,字节跳动旗下火山引擎发布大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等全方位的平台服务(MaaS,即Model-as-a-Service)。
目前,“火山方舟”集成了百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI(以拼音首字母排序)等多家AI科技公司及科研院所的大模型,并已启动邀测。
(资料图)
火山引擎并非首家选择大模型平台路径的企业,ChatGPT的创造者OpenAI已经在这条路上。此前OpenAI的生态计划是通过插件搭建体系架构,向所有ChatGPT Plus用户开放联网功能和众多插件,允许ChatGPT访问互联网并使用70个第三方插件。民生证券研报认为引入插件Plugin标志ChatGPT走在创建生态系统的道路上。
但ChatGPT的插件体系进展并不顺利,OpenAI CEO Sam Altman表示“这一模式并没有达到他们的预期”,于是他将战略方向从Chrome插件模式调转为AppStore模式,市场消息称OpenAI将与第三方合作,接入定制的面向垂直行业的模型,搭建大模型生态。
国内市场中,腾讯正在依托腾讯云TI平台打造行业大模型精选商店,为客户提供MaaS服务。垂类行业企业在其中进行挑选,再针对性进行数据精调,将其升级为企业专属大模型。
一般意义上,行业大模型“精选商店”提供涵盖模型预训练、模型精调、智能应用开发等一站式行业大模型解决方案,内置多个行业场景的行业大模型,并兼容支持多模型训练任务。
上海证券研报分析认为,“预训练大模型+微调再训练”是大模型知识迁移至下游垂类场景的主要技术架构。预计行业专属模型/垂类小模型/MaSS有望在大模型发展初期率先获益,主要系垂类模型更适配且接近下游变现场景。
谈及目前行业内大厂纷纷转向大模型平台的动作,火山引擎总裁谭待对第一财经记者表示,就整个行业而言,通用大模型未来头部会有几家巨头,但这类也存在成本高、费用贵的问题。中部大模型相对不会那么贵。再底下就是各行业内进一步缩减后的模型。每一层都会有机会,本质上,不同场景应选择最适合的模型。全球市场中也不是只有GPT-4,Google等其他公司也在快速更新与迭代。因此,如果认可头中腰部这样的架构模式,自然要把平台做好。
至于火山引擎要扮演的角色,谭待称,火山侧重于提供平台,提供安全、低成本的应用服务,目前仍坚持不做大模型。
具体营收模式方面,火山引擎智能算法负责人吴迪表示,作为中间平台,火山会将资源供应给大模型提供方,供应内包含一定的IaaS层利润,大模型提供方刨除掉基本成本,叠加自身认为合理的利润,最终形成其大模型在火山方舟上的定价。而下游客户的支付成本包括了模型服务费与平台服务费,后者火山在相当长时间内都设置为零。
吴迪称,训练大模型很昂贵,但从长期来看,模型的推理开销会超过训练开销。效果和成本的矛盾永远存在,降低推理成本会是大模型应用落地的重要因素,“一个经过良好精调的中小规格模型,在特定工作上的表现可能不亚于通用的、巨大的基座模型,而推理成本可以降低到原来的十分之一。”
在吴迪看来,不同大模型在特定任务上各有千秋,企业不必急于绑定一家大模型,而是应该结合自身业务场景,综合评估使用效果和成本,在不同场景选用更具性价比的模型。