2023年12月19日下午,南方都市报与中国政法大学数据法治研究院共同举办了第七届“啄木鸟数据治理论坛”,主题为“数据为本,AI向善”。论坛上发布的《生成式AI发展与治理观察报告(2023)》揭示了生成式AI在2023年的行业发展现状,特别关注了国产大模型的发布时间、类别、发布主体等多个维度。
大模型发布趋势:初期激增后逐渐放缓
数据显示,自2022年11月ChatGPT发布并迅速走红后,国产大模型的推出速度显著加快。2023年2月,首个国产大模型问世,随后每月都有新的大模型推出,数量逐月增加,直至7月达到顶峰——当月共推出了39个大模型。此后,发布数量逐渐减少。报告基于企业官方公开信息和GitHub上的相关数据,最终选取了190个国产大模型作为样本进行详细分析。
地域分布:北京遥遥领先
这190个大模型分布在23个省级行政区,包括自治区、直辖市和港澳台地区。其中,北京、广东、上海、浙江、江苏五个省份的大模型发布主体数量最多,分别有69家、18家、17家、12家和10家,北京占比达36%,遥遥领先。此外,还有15个省份至少有2个或以上的大模型发布主体。
发布主体多样化:企业为主导
目前,国产大模型的发布主体主要包括高校、企业、研究机构、医院和银行五大类。在这190个大模型中,有151个由企业发布,占总数的79.5%,成为主要力量。这些企业不仅涵盖了大型科技公司,还包括众多新兴的AI初创企业,展现了企业界在这一领域的积极投入。
类别分布:垂直领域占主导
从类别上看,190个大模型中,通用领域的大模型有45个,而垂直领域的大模型则有145个。垂直领域中,医学、金融、企业服务、工业、政务、科研等赛道的大模型数量较多,均为10个及以上。此外,还有城市规划、钢铁、林业、水利、心理健康等领域的大模型,每个领域仅有1个大模型。
备案制度:推动产业落地
截至2023年底,国内至少有23家大模型通过了《生成式人工智能服务管理暂行办法》备案。这意味着通过备案的大模型可以正式向社会公众开放服务,进入商用市场。备案制度不仅保障了数据安全,规范了行业发展,也为大模型的广泛应用铺平了道路。通过备案的大模型可以通过在线网址、移动应用、开源或企业内部应用等多种方式提供服务。
应用前景:不仅仅是聊天工具
生成式AI的应用不仅限于聊天工具,更应被视为一种生产力工具。文本生成、图像生成、音频生成和视频生成是四个最具代表性的赛道。其中,文本生成领域由于其底层架构的优势,更容易演化出大模型,成为当前的热点。图像生成领域因其较低的入门门槛和广泛的C端应用,逐渐渗透到影视游戏等行业。视频生成仍处于早期探索阶段,而语音生成行业的格局已经相对稳定,但随着技术进步,其商业化场景将更加丰富。
行业展望:竞争仍在继续
在访谈中,多位生成式AI从业者指出,大模型开发赛道分为三类:通用大模型、垂直大模型和基于模型的产品及解决方案开发。通用大模型由大厂和明星创业公司主导,追求与ChatGPT媲美的能力;垂直大模型则由各领域的头部企业和数据服务商开发,专注于解决特定行业的问题;第三类则是基于通用或开源模型开发的AI产品和解决方案。受访者普遍认为,大模型不应仅仅局限于聊天工具,而应更广泛地应用于各行各业,助力产业升级。尽管ChatGPT目前仍处于领先地位,但AI发展的iPhone时刻尚未到来,未来竞争的关键在于谁能更好地结合用户场景。
结语:未来充满机遇与挑战
生成式AI的快速发展带来了无限可能,但也伴随着诸多挑战。随着更多大模型通过备案,进入商用市场,我们期待看到更多创新应用的涌现,推动各行业的数字化转型。同时,如何平衡技术创新与数据安全,将是未来发展的关键议题。