首页 > 财经新闻 > 财经新闻 > AI视频进入有声时代!谷歌发布视频生成音频技术,效果惊艳网友!

AI视频进入有声时代!谷歌发布视频生成音频技术,效果惊艳网友!

发布时间:2024-06-19 22:58:06

Runway前脚刚发布Gen-3 Alpha,Google后脚就跟了个王炸。

 

北京时间6月18日凌晨,Google Deepmind发布了视频生成音频(Video-to-Audio,V2A)技术的进展,可以为视频创建戏剧性的背景音乐逼真的音效,甚至是人物之间的对话

 

V2A技术支持为AI生成视频“配乐”,Google还特别强调了官网发布的Demo视频都是由自家在五月份发布的生成视频模型“Veo”和V2A技术合作打造

 

有不少网友表示,这下终于可以给用Luma生成的meme视频配上声音了!

 

从Google Deepmind官网发布的Blog上看,V2A技术会采用视频像素文本提示来生成与底层视频同步的音频波形。

 

首先,V2A会对视频和文本提示进行编码,并通过扩散模型迭代运行,将随机噪声细化为与视频和所提供的文本提示相匹配的真实音频,最后再对音频进行解码并与视频数据相结合。

 

X网友纷纷表示太赞了,但就是有一个小小小小的问题,和同样是凌晨发布的Runway的视频生成模型Gen-3 Alpha一样,这

又是一个大家都用不上的超赞模型,到底啥时候开源让咱们试试水!

财经新闻更多>>

宝马5系要变样了 这回改的挺彻底 准备和新能源车抢市场 凯迪拉克2026年将进入F1!周冠宇将开着法拉利引擎的赛车重返F1 华为智驾+鸿蒙座舱!传祺M8乾崑来袭,国产MPV要改写“豪华”定义 续航大增104KM!新款五菱之光EV,电池30.6kWh电机仍30kW! 买车必看!宝骏和长安,谁才是保值之王? 别克君威车窗防夹功能重置:初始化操作与阻力值校准方法 全新宝马5系来了,外观大升级,比现款漂亮很多! 全新雷克萨斯ES 2026年欧洲上市:挑战奔驰E级、宝马5系和奥迪A6 新款智己L6接受实测挑战,续航真实力展现! 长安汽车:未来3年将推出35款数智新汽车,2027年推进全固态电池逐步量产 加入“9系”混战 吉利银河M9正式发布 吉利银河M9亮相!搭载千里浩瀚智驾和双腔空悬 综合续航超1500km “五一”期间长沙150余个优质楼盘推出专属优惠 各路大佬支持智己!揭开上汽如何布局未来高端智能市场 红米K80至尊版真机照出炉:核心配置也已清晰,或6月份发布 只卖1699的红米Turbo 4 Pro,但我却觉得它不太红 长安马自达 EZ-60:安全性能铸就电动出行坚实后盾 理想L9:豪华舒适,真香还是劝退?家庭出行终极选择? 埃安UT:纯电安全小钢炮,都市通勤实力王 楼市新机遇,武汉太燃了,二手房成交均价1.13万元,环比上涨4.3% iPhone14值得买吗? 降价后性价比高,销量竟反超iPhone16! CounterPoint报告2025Q1印度手机出货量:vivo占22% 荣耀400系列新机入网 预计配备7000mAh青海湖电池 奥迪全新Q5L轴距再加长!配华为ADS智驾+21寸轮毂,运动属性拉满 奥迪携手2025年金盏速度节:以赛道基因诠释百年传承与创新 TCL新品T7L Pro体验:把万元旗舰技术“搬”进客厅,这次真香了! 中兴智慧生活APP全面升级太好用,路由器体验再次提升 阿维塔12与奔驰C级:同价位,选谁更值?看完对比心中有数 雪铁龙C5 Aircross焕新:后排空间暴增,纯电续航最高679公里 五菱星光S,超长续航、超大空间,新时代国民神车,车主夸好开