生成式AI数字人:开发与制作背后的公司力量
生成式AI数字人正以前所未有的速度走进我们的视野。从杭州亚运会开幕式上点燃主火炬的数字人,到各种公司推出的不同类型的数字人产品,这一领域充满了无限的潜力和创新。
先看看在亚运会中的数字人。上亿数字火炬手的“小火苗”汇聚成的数字人形象,其背后涉及到大量的技术难题,尤其是让数字人“动起来”。浙江大学和蚂蚁集团联合发布的研究成果,一定程度上解决了数字人远距离合成复杂运动的问题。这一研究采用分层生成策略,先预测里程碑再生成动作,还利用扩散模型合成人与物体的交互,在减少GPU内存需求的同时提高了运动质量。
在数字人开发领域,有不少公司展现出强大的实力。深声科技的“照片生成数字人”内测效果良好,唇音精准同步,肢体动作和面部表情自然,还能高度还原真人容貌等。其依托多模态AI的混合技术架构,凭借独创的“AI真人数字人引擎”,仅需一张照片或一键自拍就能全自动建模生成数字人,大大降低了制作成本。
厦门黑镜科技有限公司也不容小觑。他们的黑镜生成式AI数字人在首届“文创上海”创新创业大赛中表现抢眼,荣获一等奖。其将AI技术与3D技术普惠化,把AI与数字人完美结合,为企业提供从生成到应用的一站式解决方案,助力全球企业数字化转型。
还有一些有趣的数字人相关技术和产品。例如GlatoAI能一键搞定视频的视频素材、数字人、配音和字幕,三步就能生成一个包含数字人讲解等内容的短视频。另外,苹果公司研究的HUGS技术,能在约30分钟内从简短视频中生成数字人类分身,虽然目前不能捕捉每个细节,但速度比其他方式快约100倍。
从制作数字人的过程来看,这是一个复杂的任务。首先要收集大量文字、图像、音频和视频等数据,然后清理和整理数据,提取特征,建立模型并训练,可能还需要人工干预,Zui后安装和维护。这需要大量的时间、资源和专业知识。
总的来说,生成式AI数字人制作是一个充满挑战和机遇的领域。众多数字人公司在技术研发、产品创新等方面不断努力,我们有理由相信,未来生成式AI数字人将在更多领域发挥重要作用,无论是娱乐、商业还是其他行业,都将因数字人的存在而发生巨大的改变。