端侧AI创新:DeepSeek引领智能终端新变革

AI资讯1个月前发布 IdeaSavant
4.3K 0

在2025年初,DeepSeek R1展现了强大的推理能力,标志着AI从观察“影子”阶段迈向自省和辩证的新纪元。DeepSeek蒸馏模型在短短不到两周内便成功部署在搭载骁龙平台的商用终端上,这不仅证明了AI硬件的实际应用价值,也展示了其商业潜力。高通最新发布的白皮书《AI变革正在推动终端侧推理创新》指出,DeepSeek的推出标志着AI进入了推理创新时代。训练成本的降低、快速推理部署以及针对边缘环境的创新,正推动高质量小模型的激增,加速AI跨边缘终端的部署。

从规模至上到效率优先

清华大学副教授刘知远认为,这种从“规模至上”到“效率优先”的转变,为端侧AI提供了重要启示。通过模型压缩、参数优化和算法创新,可以在保持模型性能的同时,大幅降低计算资源需求,使其更适合在终端设备上运行。例如,经过DeepSeek蒸馏后的Qwen-7B模型,其性能已经能够媲美去年推出的GPT-4o云端模型。这意味着,过去只能在云端运行的大规模参数模型,现在可以部署到随身携带的终端设备中,在本地完成复杂的推理过程,甚至实现满血运行。

智能终端的新体验形式

端侧AI的新浪潮正推动智能终端从功能性设备向具有自主理解和行动能力的智能体转变。AI作为新的用户界面(UI),将改变传统的交互逻辑。用户无需打开特定应用,AI智能体可以通过多模态输入(语音、图像、视频)直接执行任务。例如,荣耀Magic7系列中的YOYO智能体,借助骁龙8至尊版搭载的高通Hexagon NPU,提供了强大的AI处理能力,使得手机本地能够完成推理和理解等任务。

端侧AI的四大趋势

《AI变革正在推动终端侧推理创新》白皮书指出,端侧AI的四大趋势包括:先进AI小模型已具备卓越性能,模型参数规模快速缩小,开发者能够在边缘侧打造更丰富的应用,以及让Agent成为新交互入口。未来,10-20亿参数规模的模型将占用更少的运行内存,更好地适配8-12GB内存设置的终端。高通技术公司高级副总裁马德嘉表示,随着模型规模的下降,这些模型将更好地适配未来的终端设备。

异构计算架构的重要性

端侧AI的落地对芯片架构提出了更高的要求,高通通过将NPU、GPU和CPU集成到终端中的异构计算架构,实现了在更低功耗下输出更高算力,满足不同场景的AI处理任务需求。这一架构的核心在于三大处理器单元之间的协同合作。例如,iQOO 13利用骁龙8至尊版的AI算力,打造了AI电竞信号引擎,实现了多任务场景下的低时延网络优化;REDMI K80 Pro则通过AI技术优化了连接体验,显著降低了地铁场景下的微信视频和短视频卡顿率。

软件支持不可或缺

端侧AI的实现不仅依赖于强大的硬件算力,同样离不开高效、完善的软件工具支持。高通提供的AI软件栈,包括库、SDK和优化工具,简化了模型部署并提升了性能。开发者可以利用这些资源,面向高通平台高效进行模型适配,缩短AI赋能应用的上市时间。例如,用户可以通过智能手机识别食材,生成菜谱,甚至查询食物的卡路里含量,这些任务都可以在终端侧完全实现。

高通AI Hub助力开发者

高通AI Hub为开发者提供了超过100个预优化的AI模型,支持在搭载骁龙平台的终端上无缝部署。目前已有超过1500家企业在使用AI Hub,进一步推动了端侧AI应用的普及。AI Hub覆盖的终端不断增加,支持移动、PC、IoT、汽车等多种平台。高通正在成为端侧AI的首席架构师,通过与全球AI模型厂商的合作,不仅提供了强大的计算平台,还开发了完整的软件栈和开发工具,使开发者能够更轻松地将AI模型集成到应用程序中。

端侧AI的未来展望

研究机构Counterpoint Research预测,2025年将成为生成式AI手机的关键拐点,预计全球生成式AI手机出货量将从2024年的19%提升至29%,到2027年达到43%。此外,全球边缘AI芯片市场规模预计将从2023年的76亿美元增至2027年的252亿美元,汽车、工业物联网和医疗是核心增长领域。高通正在转变成端侧AI的首席架构师,推动智能终端的Agent时代真正到来。

© 版权声明

相关文章

暂无评论

none
暂无评论...