2025全球开发者先锋大会(GDC)在上海成功举办,探讨了技术创新、应用落地及可持续发展等重要议题。会上,AI产业链语料企业库帕思CEO黄海清指出,随着DeepSeek等基础大模型公司的崛起,语料行业正面临重新资源配置和自我更新的需求,必须降低成本并提高效率。
语料行业的变革
库帕思作为一家专注于人工智能语料数据服务的企业,已为多家知名机构提供了高质量的语料数据支持,包括阶跃星辰、商汤、MiniMax及上海人工智能实验室等。黄海清强调,在AI产业链中,算力、算法和算料是三个核心要素。算力需要达到十万卡集群规模;算法方面,DeepSeek等基础大模型公司已经取得显著进展;而在算料方面,丰富的应用场景将促进高质量数据的发展。
语料标注的智能化
黄海清认为,未来的语料标注应引入AI技术,实现自动化与知识化转型,从而减少人工依赖,降低数据获取成本。此外,高质量语料数据应当具备鲜活度、真实性、大样本、完整性、多样性和高知识密度等特点。当前,大模型在情绪理解与知识深度上仍存在不足,需要通过更优质的语料和算法优化来改善。
多模态大模型的兴起
随着技术进步,多模态大模型(如结合视觉、语音)将成为行业主流,使AI更加贴近人类需求。会上,阶跃星辰发布了两款开源多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。这两款模型在全球开源视频生成领域处于领先地位,并且Step-Audio是业内首款产品级的开源语音交互模型,已在跃问App内上线供用户体验。
情绪化的AI体验
阶跃星辰副总裁李华表示,多模态一直是公司的重要发展方向,开源策略旨在吸引技术社区参与,共同优化和改进大模型。特别是Step-Audio,其最大亮点在于能够根据不同场景生成富有情感、方言、语种、歌声及个性化风格的表达,提供自然流畅的对话体验。例如,当用户遇到生活中的难题时,它能像朋友一样给予建议和支持,展现出高情商的特点。
语料数据的情绪化趋势
黄海清还提到,赋予大模型“情绪”是行业发展的重要一步。缺乏情绪的AI如同冰冷的机器,而拥有情绪的大模型则可以展现有趣的灵魂,成为人们更好的助手。总之,随着多模态技术和情绪化AI的发展,未来的人工智能将更加人性化,更好地服务于人类社会。