10倍配资炒股申请_炒股杠杆开户_炒股杠杆开户申请
炒股杠杆开户

行业大模型如何降本?︱十问AI大模型(三)

发布日期:2024-01-17 13:39    点击次数:122

  

大量数据、大量参数,以及庞大复杂的算法,经过超大算力计算、训练而成的C 端类 ChatGPT大模型,在2023年陆续涌现。然而,此类TO C的通用大模型参数量太大,成本也非常高。京东集团副总裁、探索研究院院长何晓冬此前在2023世界人工智能大会上表示,训练时间在两个月左右的基础通用大模型,成本估计在几千万元。

相比之下,面向垂直领域的行业大模型所需的算力、参数量、数据量等都更小,成本更低。“通用大模型的主要成本在算力、数据和人才,其中算力是大头,To B的行业大模型成本相比通用大模型小一些,不过业务场景的策划是一个相对较高的成本。”某深耕交通和教育领域行业大模型的上市公司内部人士告诉第一财经。

据悉,大模型的总成本主要由训练成本和应用成本两部分构成。

训练成本方面,行业大模型通常采用对通用大模型进行微调的策略,这能够显著降低训练成本。“一方面只需要为特定行业领域准备数据和知识,数据准备成本能大幅度降低;另一方面,由于无需调整通用大模型的所有参数,在硬件和时间上的投入也会减少。综合来看,行业大模型的训练成本相比通用大模型有了显著降低。”鼎捷软件(300378.SZ))运营长刘波告诉第一财经。

应用成本方面,在处理特定领域的问题时,因为通用大模型不具备领域知识,需要的token数量通常较多,应用成本也因此会较高,而行业大模型已经集成了特定领域的知识,需要的token数量较少,应用成本相对更低。此外,如果选择私有化部署行业大模型,则仅需要一次性的算力投资,应用成本会进一步降低。

那么,行业大模型降本具体有哪些策略?

上述上市公司内部人士告诉第一财经,行业大模型降本,一是适当采用RAG(检索增强生成)等辅助大模型,以降低对大模型参数的要求;二是选型,根据需求的上下限选择合适参数的模型;三是从客户需求角度做场景分析,设计解决方案,适当采用模型的前处理和后处理,降低模型计算成本;四是注重性价比,在合适的场景选择合适的技术,以大模型和小模型共存的形式来降低成本,达到总体产品的合适的投入产出比。

刘波补充道,大模型和知识图谱的协同也能够有效降本。“通过与知识图谱的交互,大模型可以重用知识图谱中已有的知识,这有助于大模型在执行任务的过程中进行规划、推理和验证,降低大模型的训练成本及应用成本。”

上述上市公司内部人士同时称,对于行业客户来说,成本(价格)并非是第一考虑要素,行业大模型能否产生价值,让用户获得一个比较好的ROA(资产回报率),才是最重要的。

举报 第一财经广告合作,请点击这里此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。 如需获得授权请联系第一财经版权部:021-22002972或021-22002335;banquan@yicai.com。 文章作者

冯丽君

关键字

大模型行业大模型算力

相关阅读 国家发改委等部门:深入实施“东数西算”工程 加快推动全国一体化算力网建设

到2030年,数字经济促进共同富裕形成较为全面政策体系,在加速弥合区域、城乡、群体、基本公共服务等差距方面取得显著成效,形成一批东西部协作典型案例和可复制可推广的创新成果,数字经济在促进共同富裕方面取得实质性进展。

01-05 17:05 强化“东数西算”布局刚性约束,全国一体化算力网加快建设

国家枢纽节点外原则上不得新建各类大型或超大型数据中心,进一步推动各类新增算力向国家枢纽节点集聚。

01-04 16:32 全国一体化算力网来了,板块应声大涨,龙宇股份等4股涨停

截至发稿,直真科技、龙宇股份、智微智能等4股涨停,奥飞数据、立昂技术、思特奇等涨幅居前。

2023-12-27 09:52 五部门联合印发实施意见 加快构建全国一体化算力网

《实施意见》提出到2025年底,综合算力基础设施体系初步成型。

2023-12-26 20:24 《深圳市算力基础设施高质量发展行动计划(2024-2025)》印发

构建通用、智能、超算和边缘计算协同发展的多元算力供给体系。

2023-12-05 17:07 一财最热 点击关闭

Powered by 10倍配资炒股申请_炒股杠杆开户_炒股杠杆开户申请 @2013-2022 RSS地图 HTML地图

Copyright 365站群 © 2013-2022 365建站器 版权所有