近日,北京市广播电视局联合北京市经济和信息化局,北京市科学技术委员会、中关村科技园区管理委员会,北京市发展和改革委员会,北京市政务服务和数据管理局联合制定了《北京市促进“人工智能+视听”产业高质量发展行动方案(2025-2029年)》(以下简称《行动方案》),推动“人工智能+视听”深入融合,推进国际一流的中国数字视听制作中心和全球数字经济标杆城市建设。
打造具有国际影响力的“人工智能+视听”高地
根据《行动方案》提出的总体目标,要充分发挥北京文化资源优势和人工智能领先优势,以提升公共文化服务水平,打造更多文化体验场景,实现视听产业高质量发展为目标,加强人工智能同文化建设、视听产业发展相结合,推动“人工智能+视听”朝着有益、安全、公平方向健康有序发展,促进视听产业人工智能应用落地,打造具有国际影响力的“人工智能+视听”高地。
要全方位赋能视听产业,构建国际领先的高质量视听内容生成和影视后期制作技术创新应用机制,研发一批创新型视听内容生成工具,培育一批具有国际竞争力的内容生成企业,打造一批技术先进、产业支撑能力突出的“人工智能+视听”技术共享平台,支持市场化的AIGC视听产业服务平台稳定运营,创建一批高质量视听数据集,探索智能视听终端融合发展模式,实现视听产业多场景落地,逐步形成拥有政策示范引领、核心技术领先、智能体系精良、产业要素完备、内容供给充足、高端人才云集的新发展格局。
在加快关键技术攻关方面,《行动方案》提出聚焦高质量内容生成、智能渲染、多模态数据处理、虚拟现实、信号制作、后期制作等关键领域,推动核心技术攻关,提升自主创新能力。研发一批创新型视听内容生成工具,满足文本创作、视频制作、传输储存、后期制作、行业监管等多元场景的高精度、高效率、高可靠需求,建立覆盖基础研究、工具研发和产业化推广的全链条技术支撑网络。
在推动数据价值释放方面,《行动方案》提出聚焦文本、图像、音频、视频等多模态数据,建设国际领先、国内一流的高质量视听数据集,围绕视听数据全生命周期管理,积极探索视听数据分类分级和“监管沙盒”机制,打通视听数据汇聚、处理、开发、应用全链条环节,强化视听数据资源战略支撑能力,建设可信、安全、专业、权威的视听训练数据资源平台,支撑国产化自主通用大模型和视听垂类大模型训练优化。
在打造垂类应用场景方面,《行动方案》提出聚焦“人工智能+视听”融合创新,贯通科研攻关与应用对接机制,加速AIGC创新应用,赋能内容创作全链条,提升影视工业化生产质效,实现在电视剧、纪录片、动画片、网络剧、网络电影、微短剧、综艺节目、公益广告、沉浸式体验、超现场等重点领域应用。通过视听技术赋能文商旅体融合发展,打造具有示范效应的典型应用项目,淬炼市场影响力大、行业引领性强、要素集聚度高的标杆案例。
在提升产业生态韧性方面,《行动方案》提出培育引进“人工智能+视听”领军企业、独角兽企业,推动一批细分领域单项冠军、专精特新“小巨人”企业建设,打造产业服务平台,为产业发展提供有力支撑。强化龙头企业引领作用,吸引创新型中小企业参与,构建良好的产业合作与竞争格局,推动产业链上下游协同发展,提升产业集群效应,推动建立全链条、高端化、智能化视听产业生态。
推动技术创新、支持协同平台建设
为推动“人工智能+视听”产业技术创新,《行动方案》提出了多项措施。一是加快算法模型突破。北京将积极布局“人工智能+视听”领域垂类大模型研发,支持高校、科研机构与企业合作,加强基础理论和共性技术研究,引导共性平台在视听领域应用,提升面向各类媒体生产场景算法优化与技术迭代能力。联合打造全国领先的大模型调优工场,全面提升视听生成、媒体工艺优化核心算法的国际竞争力。
二是开展核心技术攻关。支持重点科研机构与企业联合科研攻关,集中攻克在场景一致性、逻辑连贯性、物理真实性等方面表现突出的视频生成模型训练关键技术,推动高质量、高可控的视频生成模型落地应用,重点打造具有较大影响力的AI作品。打造自主可控的渲染引擎,突破实时动态渲染、物理级光线追踪与云协同智能渲染技术,支持4K/60fps影视级输出,提升渲染质效。建设国产化智能工具集,提供低代码组件与标准化API接口,赋能视听企业高效创作。
三是促进技术创新应用。鼓励内容制作企业、硬件生产企业与科研机构合作,支持采编播传显系统智能化改造及业务模式重构。推动生成式与判别式技术融合创新,实现人工智能技术在视听领域的集成适配。支持内容制作企业应用多模态违规识别、深度伪造检测、区块链等技术,加强内容安全审核。
在加强核心要素供给方面,《行动方案》提出,一是强化算力筑基。北京将搭建低延时算力推理圈,保障视听内容智能化采集、传输、实时处理、审核等应用需求。支持国产化算力技术应用,构建安全算力环境,保障视听领域垂类大模型训练、推理和行业应用的安全隐私需求。支持应用绿色节能技术,降低能耗,提升算法能效比,降低视听内容生成与渲染的算力成本门槛。
二是建设高质量视听数据集。聚焦多模态数据采集与整合,支持行业推进AI内容生成数据集标准建设,打通全链条,规范数据采集、处理和共享流程。聚焦视听行业发展需求,建设高品质可信视听数据集,统一规范技术指标。构建安全可靠数据空间,支持建设多模态视听数据资源池。探索视听领域“监管沙盒”机制,明确准入标准、测试范围、效果评估及退出机制。加强高品质视听数据集分类分级管控,支撑数据高效流通和融合应用。利用人工智能数据训练基地,为大模型企业提供数据治理、智能标注和训练服务。
在支持协同平台建设方面,《行动方案》提出,一是加快科学创新规划布局。坚持政产研学用协同,创新工作机制,推动视听与文商旅体等多领域融合发展。聚焦构建“科技攻关-成果转化-场景应用”闭环,依托区位资源优势,支持内容制作企业、科研院所等开展“人工智能+视听”研究,聚合要素资源,联合开展科研攻关和应用示范。
二是加快智能体研发。围绕场景需求与模型创新应用,建设面向“人工智能+视听”智能体开发平台,搭载多种基座模型,提供剧本生成、自动剪辑、场景合成等功能的智能体开发组件,构建自主可控的模型交互协议,支持用户通过平台快速构建视听智能体,降低视频制作的技术门槛和制作成本。
三是搭建数字资产交易平台。支持内容制作企业、视听产业园区、科研机构、数字资产运营商,共同构建高品质视听数据运营平台或依托北京国际大数据交易所开展相关数据运营,引导利用区块链和智能合约技术开发新业态,保障交易过程安全可信、可追溯。
四是鼓励构建AIGC视听产业服务平台。支持产业园区运营方、孵化器、企业、社会组织等主体建设并持续运营AIGC视听产业服务平台,提供技术研发支持、应用推广、投融资等相关服务,推动建设AIGC视听产业创新生态体系。
积极拓展“人工智能+视听”应用
《行动方案》提出要积极拓展应用赋能。一是赋能内容创作。鼓励利用人工智能技术进行内容创作,赋能电视剧、纪录片、动画片、网络剧、网络电影、微短剧、综艺节目、短视频、公益广告、沉浸式体验、超高清视听舞台艺术等应用,赋能业务流程,缩短制作周期,降低制作成本,增强视觉效果。
二是赋能影棚剧院。鼓励人工智能赋能水下摄影棚、XR虚拟摄影棚、虚拟现实动作捕捉摄影棚、舞台艺术等领域应用,提高舞美置景、景别切换、剧组转场效能,增强互动性、沉浸感。支持电影放映厅、剧场技术升级,打造超高清沉浸式新场景。
三是赋能网络生态。推动“人工智能+视听”技术在网络直播、视频剪辑、企宣推荐、社交娱乐、智能分发等领域的深度应用,提高内容创作效率,促进精准分发,降低内容创作与传播成本,推动互联网内容生态更加健康多元。
四是赋能融合发展。促进文商旅体广电融合发展,鼓励“人工智能+视听”技术在虚拟场景构建、精准营销和个性化服务等领域的创新应用,提升文化产品创新和互动体验。利用视频生成技术对北京文物古迹活化宣传,通过超高清裸眼3D和AIGC相结合,打造生动呈现历史文化景观。促进LBE大空间技术发展,打造文化娱乐消费体验新地标。
五是赋能动漫产业。推动“人工智能+视听”技术在动漫上下游产业的应用,聚焦设计与创新、美术资源自动化生成与优化、智能程序算法与优化、个性化音效与配乐创作、精准反作弊与安全防护、智能玩家匹配与社交互动增强等进行产品和服务开发,缩短更新周期,降低开发成本,优化用户体验,推进人工智能驱动的多模态营销内容自动化生产与精准分发体系建设。
六是赋能广告生态。推动“人工智能+视听”技术赋能广告内容生成、制作、投放,实现降本增效,推动传统广告业提质升级,实现向即时响应、情境驱动转型,更好满足用户个性化需求。支持AI数字人等加速落地广告营销、电商直播等应用场景。
七是赋能终端应用。构建“端侧AI芯片+视听算法+智能体”的融合技术创新体系,重点发展AI电视、AI手机、AI眼镜、AI PC、AI车载音视频、AI数字人等新型智能终端产品和服务。支持终端制造企业与视听数据平台、科技企业合作,开发面向智慧工业、智慧交通、智慧教育、智慧医疗、智慧社区等领域的视听应用解决方案。鼓励企业加强端侧AI推理能力建设,通过边缘计算和云端协同,实现视听内容的实时生成、智能编辑和个性化推送,提升用户沉浸式体验。建立智能视听终端测试验证平台,推动形成行业标准和评价体系。
八是加快国际开放合作。支持优势企业“走出去”,推广自主创新产品,推动智能翻译模型、微短剧多语种制作等优势领域发展,打造“人工智能+视听”出海典型案例。鼓励境外、京外企业和机构在京设立总部基地、研发中心、实验室和创新基地,推动国际资源与技术引入,开展国际合作项目。积极参与国际规则制定,提升北京人工智能视听产业全球影响力。