信息服务

大模型+大算力融合 云计算能为AIGC做什么

发布于:2023-06-20 点击量:800 来源:天极网

【飞天商业 老谢】AIGC,即AI Generated Content,人工智能生成内容,通常包括写作、绘画、音乐、视频等领域,有文生文、文生图、文生音视频等多种功能。在ChatGPT横空出世后,AIGC产业迅速成为世界焦点。

AIGC产业爆发

不过,ChatGPT这类大模型运行的背后,需要强大的算力来支撑。据相关资料,OpenAI的GPT-3参数量达1750亿,预训练数据量达45TB。ChatGPT日常用户访问对应算力设施初始投入成本,据测算约30-40亿美元。ChatGPT经常因访问量激增而宕机,这些都体现出了AIGC产业对于算力等基础设施的海量需求。

除了AIGC,各行各业也都开始打造适合各自领域的大模型。面对AIGC、大模型落地带来的海量市场需求,云计算行业也相应动作起来,不少云服务厂商都推出了相关产品。

云计算能为AIGC提供什么

AIGC产业需要处理大量的数据、进行复杂的计算,云计算平台可以提供高效、稳定的服务。云计算可以提供构建大模型算力底座的计算资源、网络连接、数据存储和模型管理等能力,解决大模型的托管、存储、部署、运行等,帮助用户快速创建和部署模型等。

算力:大模型运行时对算力要求很高,需要性能强大、稳定的计算资源。云平台的优势是可基于通用服务器和专属硬件,统一提供CPU、GPU等多种异构计算资源的调度及管理,通过虚拟化管理能力,一键部署底层计算资源并运行模型,充分利用不同异构资源的硬件加速能力,加速模型的运行及生成速度。AIGC的计算需求通常是不确定的,可能需要一些弹性计算能力,以应对高峰时期的需求。云计算能提供按需分配计算资源的能力,需要时可进行伸缩。

数据存储:大模型运行时会使用和生成大量数据,需要可靠的数据存储和备份机制。云平台的分布式存储,支持多存储类型协议,可提供稳定可靠、开放兼容、弹性扩展的块、文件和对象存储服务。同时结合多副本、多级故障域、故障自恢复等数据保护机制,可保证模型和数据安全稳定运行。

网络:AI模型的训练和推理需要大量数据的传输和存储,对于基础底座的网络性能要求较高。云计算可提供算力资源的网络和存储,并通过分布式网络机制进行转发,透传物理网络性能,基于25G、40G网络可显著提高模型算力的效率和性能。

安全保障:云计算可从多个层面保障模型和数据的安全。云平台支持多租户和VPC隔离网络,结合云防火墙,可严格进行数据隔离和访问权限控制;在模型托管方面,对模型仓库实行严密的权限管理机制;在数据存储方面,通过私有化部署和数据磁盘加密保证安全可控;在模型分发和运行过程中,也提供全面的账号认证和日志审计功能,全方位保证模型和数据的安全性。

模型管理:云厂商可提供大模型统一托管服务和大模型仓库,AI企业用户可自定义模型的上传、下载、权限控制、分发部署及运行。提供多种模型部署模式,可灵活定制API发布和一键打包应用,方便用户管理AI模型。

市场潜力巨大

AIGC正在成为数字内容创新的引擎。展望未来,AIGC发展加速,算力、通信及存储需求的提升,将带动云计算等相关产业的发展。

据IDC数据,2021年全球人工智能IT投资额为929.5亿美元,预计2026年将增至3014.3亿美元,复合年增长率约26.5%。这是一个相当大的市场。据中国信通院数据,2021年全球计算设备算力总规模达615EFlops,其中基础算力369EFlops,智能算力232EFlops,超算算力14EFlops,预计2030年全球算力规模将达到56ZFlps,平均年均增长65%。

总的来说,云计算可以为AIGC产业的相关企业和机构提供高性能的基础设施,高效、安全的AI模型管理和服务,有效保护数据隐私和模型安全,促进AI创新。

【版权声明】:本站内容来自于与互联网(注明原创稿件除外),如文章或图像侵犯到您的权益,请及时告知,我们第一时间删除处理!