当前位置:
OFweek 云计算网
> 正文
文字直接转视频,科学家用机器学习算法实现这种操作
2018-02-27 11:13
来源:
镁客网
近日,《Science》杂志公布了一项新的机器学习算法,该算法可根据文本或者碎片式的信息来重建完整的视频,如根据证人描述重现事故现场。
据了解,该算法是一种小型神经网络,即一系列小型计算元素层。其主要的工作分为两个阶段:一是通过文本生成视频的“主旨”,即一个模糊的背景图片上加注一些重要的标注;二通过综合“主旨”和文本内容产生一个短视频。此外,在训练过程中,第二部分的网络会对新增加的视频内容进行反复的对比,以提升性能。
目前,研究人员采用了十种生活场景对其训练,包括在草地上打高尔夫、在海上玩风筝冲浪等,算法生成的图像还比较粗糙,呈现VHS录像的颗粒感画面。现在,可达到高准确率的视频约为32帧,持续时间为1秒,大小为64×64像素。研究人员之一,杜克大学的计算机科学家Yitong Li解释道,“更高的分辨率会降低其准确度。”
虽然当前算法生成的视频尚十分粗糙,但是这项研究实现了文本直接转视频技术上的质的飞跃。“这是一个非常难的问题,而他们的方法非常有趣,只要两个阶段。所以,对于他们现在取得的成就和突破,我感到非常高兴。”马里兰大学计算机科学家Hamed Pirsiavash评价道。
比利时鲁汶大学计算机科学家Tinne Tuytelaars也对此赞不绝口:“这是我所知道的第一部如此棒的文字转视频作品,它不完美,但至少看起来像是真正的视频。这真的很好。”
声明:
本文系OFweek根据授权转载自其它媒体或授权刊载,目的在于信息传递,并不代表本站赞同其观点和对其真实性负责,如有新闻稿件和图片作品的内容、版权以及其它问题的,请联系我们。
最新活动更多
-
4日10日立即报名>> 维科杯· OFweek 2025中国机器人行业年度评选
-
4日10日立即报名>> OFweek 2026(第十五届)中国机器人产业大会
-
5月14日立即下载>> 【白皮书】村田室内外定位解决方案
-
即日-6.1立即参编>> 【企业参编】2026人工智能+场景化、图谱化智能制造发展蓝皮书
-
7月10日立即报名>> OFweek 2026中国智能制造产业大会
-
4月30日立即参评>> 【评选】维科杯•OFweek 2026中国智能制造行业年度评选


分享











发表评论
登录
手机
验证码
手机/邮箱/用户名
密码
立即登录即可访问所有OFweek服务
还不是会员?免费注册
忘记密码其他方式
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论