清华大学文生视频专利公布
2024-05-11 【 字体:大 中 小 】
国家知识产权局网站显示,2月2日,清华大学申请的“一种定制化多主体文生视频方法、装置、设备及介质”专利公布。
专利摘要显示,该申请提供一种定制化多主体文生视频方法、装置、设备及介质,涉及神经网络技术领域,包括:获取多个主体分别对应的主体文本表述以及主体图像;基于多个主体分别对应的主体文本表述以及主体图像,获取混合文本以及组合图像;将混合文本以及组合图像输入文生视频模型,生成第二噪声预测值,并基于第二噪声预测值与组合图像,获取第二损失和第三损失;基于第一损失、第二损失与第三损失,对文生视频模型进行优化,得到优化的文生视频模型。该申请通过多种损失对文生视频模型的参数进行优化,使优化的模型基于文本描述生成视频中的图像时,文本描述与定制化主体保持一致,且在每个主体在生成过程中的特征不会发生混淆的同时消除合成痕迹。
猜你喜欢
从8-11降至3-4个月,瑞银称英伟达大幅缩短AI GPU交付周期
广东省人大代表蔡铁强:优化高新技术企业认定评审 为企业松绑减负促进创新|广东两会
证监会:加大科技型企业再融资支持力度
问世40载仍能一年吸金70亿!《龙珠》,再见了……
云峰新材:供应商身兼客户上演控制权迷局 募投项目投入金额现“不同版本”
“九章三号”光量子计算机刷新世界纪录 我国量子通信已具初步商用条件
突发!朝鲜决定废除与韩国所有经济合作协议
《泰坦尼克号》制片人去世,享年63岁
美好医疗(301363)5月17日主力资金净卖出62461万元
万科南方区域重组8大城市公司 对应调整管理人员
,游资校长,前辈游资大佬,职业炒手交割单实盘图解(2)
立体式文化出海传播,让“华流”影响世界
住建部:加快推动收购存量商品房用作保障房
数字时代出版人才发展分论坛共话技术革新挑战与机遇
飞潮新材终止科创板IPO 原拟募资928亿国金证券保荐
金十:OPEC大会抢先看 请盯紧这四大要点
喝葡萄酒你可能会遇到的7个难题
橙天嘉禾(01132)6月24日复牌
共叙友谊,共话希望!中法高级别人文交流论坛在法国巴黎举行
隔夜外盘:通胀转冷预期高涨 美股三大指数日线四连涨