以 AI 生成短片 引領「內容創作」的一場革命
- techstock HK
- 4天前
- 讀畢需時 3 分鐘

隨著「生成式 AI 」熱潮席捲全球,內容創作領域已俏然掀起一場革命。早前就有外國機構分析,2023 年全球 AI 短片市場價值已高達 5.53 億美元,報告更認為 AI 短片市場的規模將持續擴大,至 2030 年將擴大三成半。在全球 AI 短片熱潮迅速發展的今天,有內地初創企業就推出 AI 短片生成服務,為各類商戶製作不同短片,近期他們更將服務擴展至歐美市場,搶佔 AI 短片的龐大市場。

作為專注於 AI技術應用的企業,VisionStory AI 的核心產品正是他們運用 AI 而成的短片生成平台。通過 AI 的學習能力與生成技術,VisionStory AI 能僅僅憑用戶提供的一張圖片、一段文字或一段音訊,生成出像真度高、由虛擬化身演繹內容的「Talking Avatar」類短片。現時 VisionStory AI 的服務已支援多達 30多種國家語言,近年亦將服務擴展至廣東話,能為客戶產生出最地道、最啜核的廣東話短片。
AI 高效學習 50秒極速生成短片

訪問 VisionStory AI 的首席運營官鄭穎,他就提到「生成式 AI」的應用大大提高了 AI 短片的質素與生成速度。原來,過往要做到類似的虛擬分身口述短片,用戶首先要預錄一段數分鐘的短片,拍攝上亦最好備有綠幕,方便利用電腦將「人」與「背景」分離,下一步才是將影片交給 AI 學習,從而讓 AI 產生一些新的說話內容;但隨著 AI 科技發展,鄭穎坦言現在能夠「將一切交給 AI」,透過 AI 從極大量的數據之中學習,AI 即能模擬說話者的口型、動作、姿態,生成影片。例如,用戶只需上傳一張二人合照,VisionStory AI 即能生成一段二人說話的短片,甚至可選擇切換鏡頭、內容自動生成內容等功能。加上 AI 的高速運算能力,現時他們產生約 10 秒的短片,僅需花 50 秒,大大省改製作短片的時間之餘,亦能製作出延遲只是數百毫秒的 AI 實況片段。
鄭穎分享,現時不少學校或企業便以 AI 短片作為教學工具,亦有內容創作者以此技術生成影片。未來,他們亦逐步提高 AI 的學習效能,例如會增加虛擬分身的手勢、動作,甚至是做到「人」在說話的同時,與場境和物體進行互動。鄭穎又形容,將來這類 AI 短片的說話者,「會更多地從一個說話的人,變成一個在表演的人,或變成一個 character」,長遠由專門的 AI 領域,慢慢變成大眾也能夠使用的 AI 短片技術[TIM1] 。
以 AWS 控制成本 進軍海外
提到未來動向,鄭穎更提到會將 VisionStory AI 帶到歐美地區,但原來早在進軍亞洲、衝出中國之時, VisionStory AI 已利用 AWS 的服務,將平台由國內拓展至香港市場。鄭穎指,其公司正是採用 AWS 的 EFS 服務,讓他們在兼顧用戶流量的情況下省減成本。具體做法,就是透過 AWS 的數據分流服務,將較冷門的數據儲存於成本較低的伺服器,相對熱門的數據則存放在 SSD,以助不影響速度的情況下省減營運成本;鄭亦補充,他們透過 AWS CloudFront 服務,整合產品的前端與後端,有助他們減少研發成本。加上 AWS 本身跨國企業優勢,能有助他們完成模型文件、系統設置等高質的跨地區傳料傳輸[TIM2] ,並輕易將網站的網頁資源部署於全球各地,鄭認為,採用 AWS 的雲端服務有助他們應對未來的挑戰,完善他們的 AI 產品,進一步將商品推廣至全球各地。
總結而言,VisionStory AI 在全球「生成式 AI」的熱潮下,憑藉其創新的 AI 短片生成技術,正在重塑內容創作的未來,帶來一場「創作者的革命」。未來,隨著全球 AI 短片市場的快速擴長,預計如 VisionStory AI 這類能提供高性價比和高效服務的企業,將能藉住合作黟伴 AWS 的優勢,引來全球中小企業和內容創作者的青睞,「生成」出專屬於他們的「AI 成功故事」。
[TIM1]長遠是由目前專注於說話視頻生成的領域,擴展到更通用的視頻生成場景
[TIM2]這裏說明了跨地區傳輸的數據類型,因為很多國家不允許用戶資料的跨地區傳輸
Comments