2025年7月3日,北京举办了全球数字经济大会中的“人工智能融合应用发展论坛”,在此场合,快手公司的副总裁、可灵AI技术的负责人张迪发表了主题演讲,向与会者展示了可灵AI在技术创新及实际应用推广领域的最新进展。
在《AI时代的视觉表达新基建-可灵AI的技术创新与应用场景突破》的主题演讲中,张迪对视觉表达的发展历史进行了回顾。他指出,相较于过去的摄像机、手机等设备,AI技术使得视觉表达的能力范围得到了显著拓宽。它以更低的成本,让创意内容的生产变得更加丰富和富有想象力,从而使每个人都能借助AI讲述精彩的故事。
在此情境下,以可灵AI为核心的大规模模型技术正致力于打造全新的视觉表达基础设施。张迪指出,自上线以来,可灵AI已更新迭代超过20次,现已成为集AI图片、AI视频及AI音频功能于一体的多元化创意生产平台。数据显示,可灵AI的用户数量已经超过了2200万,总共制作了1.68亿个视频以及3.44亿张图片,其年度经常性收入(ARR)已经超过了1亿美元,堪称国产大型模型快速发展的典范。
近期,可灵AI发布了2.1系列模型,视频生成效果实现了新的飞跃,同时在动态效果、语义反馈、视觉美感等多个方面持续保持国际领先地位。张迪指出,这些显著的进步主要归功于可灵团队卓越的技术实力。在过去两年里,该团队在国际顶级会议上发表了80余篇论文,累积引用量超过3万次,其主导的GitHub开发项目也收获了超过1.5万的点赞。
张迪亦透露了可灵AI在众多行业中的应用突破情况。在影视制作方面,他于去年九月携手国内九位著名导演共同创作,借助可灵AI技术制作出高水准的电影作品,这在我国电影(600977)产业发展史上具有里程碑意义的一次尝试。近期,可灵AI发布了全球首部AI叙事单元剧集《新世界加载中》,该剧集在上线首日便实现了播放量突破3000万;在文化旅游领域,该平台推出的多项创新特效,有效助力各地文化旅游和高校制作出热门地标视频,在网络上引发了广泛关注;此外,在广告营销领域,可灵AI与周大福、青岛啤酒(股票代码:600600)、玛氏等知名品牌合作,成功完成了首个实体量产AIGC IP联名项目,充分展示了AI技术在广告制作方面的强大优势。
在此次会议上,亦正式揭晓了“北京数字经济十大标杆应用”的名单,其中可灵AI荣幸地成为入选者之一,集中展示了北京打造全球数字经济标杆城市的显著成效。据消息,北京市人工智能领域的核心企业数量已超过2400家,而核心产业的总规模也接近3500亿元,这两个数据均超过全国总量的一半。