中国自动化网 - 自动化行业门户网站 !

商业资讯: 行业动态 | 自动化要闻 | 企业新闻 | 产品新闻 | 产业视点 | 企业专题 | 会议快报 | 故障维修 | 行业专题 | 技术专题

你现在的位置: 首页 > 商业资讯 > 企业专题 > 3分钟样本训练、24小时生成,数智人生产“自动化”时代来了
U.biz | 商业搜索

3分钟样本训练、24小时生成,数智人生产“自动化”时代来了

信息来源:coaoo.com   时间: 2025-02-18  浏览次数:81


【通信产业网讯】(记者 崔亮亮)当前,越来越多的数字人走入各行各业,但高昂的制作和运营成本让不少企业望而却步。如何让数字人从大企业走向小商户,成为小微企业经营的“可选项”,甚至成为个人创作者的创作工具?

近日,在腾讯云智能数智人媒体沟通会上,腾讯云智能小样本数智人生产平台首次对外发布。《通信产业报》全媒体记者了解到,小样本数智人生产平台具有训练样本小、生产效率高、自动化生产等特性,可以轻松实现“自助式”数智人生产制作。只需要3分钟真人口播视频、100句语音素材,平台便可通过音频、文本多模态数据输入,实时建模并生成高清人像,在24小时内制作出与真人近似的“数智人”。千元级别的成本,小时级的制作时长,大幅降低数字人使用门槛,为短视频创作、知识分享、带货直播等场景应用提供了更多可能性。

腾讯云智能数智人产品总经理陈磊表示,腾讯云智能正致力打造自动化的“AI+数智人工厂”,以“产、销、服”一站式平台,实现“自助式”购买、生产和应用数智人。通过开箱即用的数智人服务,腾讯云智能还将广泛开展生态被集成合作,携手合作伙伴将更逼真、更智慧、更高效的数智人应用落地千行百业。

陈磊表示,小样本数智人支持半身、全身形象展示,手势动作会根据内容灵活调整,也支持录制背景任意更换,适用于直播带货等更广泛的商用场景。相较于2D真人精品数字人,小样本数智人无需专业影棚录制素材,成本更低;相较于照片生成、仅能呈现面部形态的数字人,小样本数智人可根据文本设计手势,唇动、口型、表情复现真人风格。

在沟通会上,数字经济学者刘兴亮现场展示了他的专属“数智人”,以及由这个“数智分身”输出的短视频“亮三点”。刘兴亮分享称:“这个形象近似真人,表情、唇型匹配自然,包括我的特色口音也模拟得惟妙惟俏的数智人,正是腾讯云智能小样本数智人。未来,不需要搭建拍摄场地,也不用提前化妆彩排,不受空间、时间限制,数智人可以随时随地帮我生成口播视频,解放我的生产力。”


数字经济学者刘兴亮用小样本数智人生产视频

为了加速数智人服务普及,腾讯云智能还提出自动化“AI+数智人工厂”的方向。开箱即用的数智人生产服务,依托腾讯云TI平台,内置超过10项AI算法能力。未来,无需任何算法、研发经验,只要在平台导入视频、语音训练素材,即可通过“自助式”服务,完成大批量数智人形象、音色定制。

针对数智人运营,腾讯云智能提供播报数智人平台、交互数智人平台服务。播报数智人平台支持通过文字、语音输入快速生成数智人视频;交互数智人平台可打造“超长待机”的数智员工,可定制专属问答库,提供7*24小时人机双向交互服务。同时,也可实现数智人直播服务,直播间7*24小时不断档,自由切换真人语音接管,与用户问答互动。



腾讯自2018年开始投入数智人研发和服务,是国内最早投入数字人领域的企业之一,已发布数百篇相关技术顶会、期刊论文、专利近百份。

腾讯优图实验室研究总监汪铖杰表示,2D小样本技术的背后是3D技术。“小样本数智人从直观上感受是2D视频,背后其实是3D人像在做支撑。从‘文本/音频’信息到‘3D人像驱动’再到‘2D人像视频’的模式,通3D人脸结构的先验信息引入,使数智人口型、表情更到位,让小样本数智人形象实现‘皱纹级’还原。”



目前,腾讯云智能数智人已经覆盖3D写实、3D半写实、3D卡通、2D真人、2D卡通五种形象风格,可实现超细微面部情感表情以及数百种肢体动作,支持形象资产管理、业务服务配置及内容生产相关服务,以满足不同场景下的服务需求。作为数智员工,腾讯云智能数智人已成功“入职”传媒、金融、出行、文旅、政务等多个行业,依托新一代的多模态人机交互系统,同时连接腾讯丰富的内容和服务生态,实现从“数字人”智能升级到“数智人”。

未来,面向数智人应用,腾讯云智能将不断通过CV、TTS、NLP、ASR等多项自研AI技术,推动数智人服务更广泛落地,以“普惠化”服务走入千行百业。


    ——本信息真实性未经中国自动化网证实,仅供您参考