新华网于7月4日在北京报道,记者张漫子采访了快手科技的副总裁、可灵AI技术的负责人张迪。张迪在2025全球数字经济大会人工智能融合应用发展论坛上指出,人类视觉表达的历史中,曾以摄像机为媒介,随着移动设备的兴起,媒介转变为手机,而如今,AI技术已经成为了新的媒介。
7月3日,张迪于2025全球数字经济大会人工智能融合应用发展论坛发表演讲。新华社摄影记者张晨霖现场拍摄。
张迪举例说明,若一部带有科幻元素的广告影片运用了可灵AI技术,其制作成本可降低至原来的约十分之一。他指出,视频生成模型不仅拓宽了创作的可能性,还革新了内容制作流程,使得更多的人能够以更低的投入创造出富有创意的作品。
自去年起,以可灵AI为先锋的国内视频生成模型在海外市场崭露头角,凭借其流畅、创新、充满想象力的视频制作体验,充分展示了中国在人工智能技术和产品方面的卓越实力。
依据2025年快手第一季度的财务报告,该季度可灵AI的营业收入成功跨越了1.5亿元人民币的大关。进入今年3月份,可灵AI的年收入运行率(ARR)实现了历史性的突破,达到了1亿美元以上。此外,4月和5月这两个月的月度付费收入也均超过了1亿人民币。
这一数据的背后,体现了技术研发和应用落地的双重推动力。在接受记者采访时,张迪提到,可灵AI的技术优势源于其研发实力和研究能力的同步提升。特别是在底层技术领域,短短两年间,可灵AI团队就发表了超过80篇国际顶级期刊和会议论文,并且这些论文获得了超过3万次的引用。
张迪指出,以技术路线为参照,一方面,可灵AI依托于现成的、成熟的路径进行深入挖掘,力求将模型的表现力提升至顶峰;另一方面,它还跳出常规,创新性地探索那些充满潜力的新兴技术路径。
较强的应用技能使得可灵在短短一年内实现了多项突破,包括视频基础质量的显著提高、可控性和稳定性的精确度增强,以及多模态理解和生成技术的深度融合。具体到行业应用,可灵AI在影视制作和广告营销领域的应用比例不断上升,同时在游戏行业也加强了研发和探索的力度。
目前,我国人工智能领域正展现出基础设施构建、技术研发突破、产业广泛应用以及用户需求推动等多重优势。在全球巨头激烈竞争的背景下,我国AI企业信心满满,深知技术创新的脚步不容停滞。
张迪表示,我们的目标在于让每个人都能借助AI讲述出精彩的故事。讲述一个优秀的故事,首先需从技术实现层面,通过画面重现人们心中的想法;若能更进一步,让AI展现出超越人类内心深处的创意,实现人与智能机器的互动协作以及启发式创作,这便是从基本可用迈向真正好用的关键所在,也是我们接下来需要努力的方向。