Google發表兩款文字轉影片工具Imagen Video與Phenaki

 

Google

不讓Meta的專美於前,Google也在本周發表兩款文字轉影片工具,分別是強調影片品質的,以及主打影片長度的。

其中,Imagen Video奠基於Google的上,採用串連擴散模型(Cascaded Diffusion Models,CDM)來產生高解析度的影片。先透過自然語言處理預訓練模型T5嵌入使用者所輸入的文字後,由一個基本的影片擴散模型以每秒3幀的速度產生一個解度析為24×48的16幀影像,之後再利用多個Temporal Super-Resolution(TSR)與Spatial Super-Resolution (SSR)模型,最終產生每秒24幀,總長128幀且解析度高達1280×768的5.3秒影片。

,並宣稱Imagen Video可用來創造類似梵谷(Van Gogh)水彩畫風的影片。

掌握產品行銷策略,帶你認識商品包裝設計基本要素

包裝設計是兼具美感和實用、設計和製作印刷的精緻工藝。包裝設計包含了結構規劃、視覺設計、材質選定及後續的生產加工

臭氧機推薦

臭氧機、紫外線燈作水質淨化、殺菌設備,因臭氧機具強大氧化、殺菌、除臭能力,省電、無耗材費用,深受水處理業者採用

專業客製化禮物、贈品設計,辦公用品常見【L夾】搖身一變大受好評!

採用PVC0.2白色軟皮料印製,4色印刷加上表層防刮油墨,另也可選表層上亮膜。

常見的貨櫃種類?

金誠貨櫃屋尺寸均依國際標準組織ISO (International Standardization Organization) 認定標準,並區分成鐵貨櫃、冷凍貨櫃和特殊貨櫃三種類型。

至於Phenaki則可用來建立總長多達數分鐘的影片,只是影像品質不若Imagen Video。可將一段具備一定長度的提示文字變成任意長度的影片,或許只是一段一直騎著摩托車的影像,或者是有一頭獅子奔馳在長型的辦公桌上,最後卻穿上了西裝辦公。令人驚喜的是,Phenaki所呈現的影片非常貼近文字描述,而且Google認為它不僅可用來產生描述單個概念的影片,還能可根據一系列的文字,產生有連貫性的多個影片。

圖片來源/Google

由於圖像資料集的數量遠大於影片,使得不管是Imagen Video或Phenaki都同時利用影片與圖像進行訓練,並發現它的確對產出的品質與多樣性都有所助益。

有鑑於用來訓練Imagen Video的資料中可能含有許多不適當的內容,因此Google目前並不打算釋出或開源該模型。

https://www.ithome.com.tw/news/153491

好的茗茶,更需要密封性高的茶葉罐,才能留住香氣!

鴻和興精密工業股份有限公司,是由在台灣專業生產茶葉罐、奶粉罐具有領先地位的光華金屬所投資組織成立的一家專業製造包裝材料之馬口鐵罐製造廠,秉持的專業、品質、服務、效率為各大客戶服務。

真空封口機該不該買?使用心得分享

各式封口機、包裝機械、客製化訂做、特殊改造

真空封口機該不該買?使用心得分享

各式封口機、包裝機械、客製化訂做、特殊改造

常見的貨櫃種類?

金誠貨櫃屋尺寸均依國際標準組織ISO (International Standardization Organization) 認定標準,並區分成鐵貨櫃、冷凍貨櫃和特殊貨櫃三種類型。