Autoflip,谷歌的新人工智慧模型可以為任何螢幕尺寸客製化視頻

想必我們每個人都或多或少遇到過在行動裝置上觀看影片顯示畫面出現「鋸齒」的情況。煩惱和煩惱可能是立即出現的感覺,但你仍然必須接受它並觀看整個視頻,因為你根本無法做任何其他事情。

為了解決這個看似很小但對用戶體驗影響很大的問題,Google 的AI 研究團隊成功開發了一種名為Autoflip 的開源解決方案,它可以自動微調視頻,以便在多種情況下適應給定的設備或螢幕尺寸。模式,如橫向、方形、縱向等。

Autoflip,谷歌的新人工智慧模型可以為任何螢幕尺寸客製化視頻

基本上,Autoflip 工作在三個主要階段:場景檢測、視訊內容分析和最後的微調。

在場景偵測階段,機器學習模型在從一個場景剪下或跳到另一個場景之前會大量關注該點。因此,它可以將一幀與前一幀進行比較,以檢測顏色和相關元素的變化。

Autoflip,谷歌的新人工智慧模型可以為任何螢幕尺寸客製化視頻

在辨識出基準鏡頭後,人工智慧模型將繼續分析影片內容,以識別場景中的重要物體。為此,Autoflip 將使用深度學習神經網絡,幫助其清楚地識別場景中出現的物體,例如人、動物、車輛、樹木…,還可以識別物體的運動以及運動狀態。目的。

在最後階段,AI模型決定對於發生在單一空間中的場景是否應該使用靜止模式,或者在感興趣的物體不斷移動時是否應該使用追蹤模式。根據這個因素以及影片需要顯示的目標尺寸,Autoflip會裁剪顯示幀以確保流暢,尤其是保留所有有趣的內容。

Autoflip,谷歌的新人工智慧模型可以為任何螢幕尺寸客製化視頻

谷歌人工智慧研究人員表示,Autoflip 可用於將影片轉換為多種格式和螢幕尺寸,無需人工幹預。在下一階段,團隊希望提高 Autoflip 追蹤採訪和漫畫中的主題的能力。為此,AI 模型需要配備模糊圖像和文字檢測技術,以便更好地將前景和背景物件放置在幀中。

您可以參考 Autoflip 的程式碼HERE

Leave a Comment

在 Windows 10 上打開設備管理器的 6 種方法

在 Windows 10 上打開設備管理器的 6 種方法

如何在 Windows 10 上打開設備管理器,獲得最佳解決方案。

歐洲將成立ChatGPT工作小組

歐洲將成立ChatGPT工作小組

聯合歐洲國家隱私監管機構的機構週四表示,已成立一個專門負責 ChatGPT 的工作小組

AI預測人類死亡時間,準確率達78%

AI預測人類死亡時間,準確率達78%

丹麥和美國科學家合作開發了一種名為 life2vec 的人工智慧系統,能夠高精度預測人類死亡時間。

AI僅透過尿液聲音預測泌尿系統疾病

AI僅透過尿液聲音預測泌尿系統疾病

一種名為 Audioflow 的人工智慧演算法可以聆聽排尿的聲音,從而有效、成功地識別患者的異常尿流和相應的健康問題。

調酒師注意了:這個機器人只要1分鐘就能調出一杯雞尾酒

調酒師注意了:這個機器人只要1分鐘就能調出一杯雞尾酒

日本的老化和人口減少導致該國缺乏大量年輕工人,特別是在服務業。

當數百人得知他們所愛的女孩是人工智慧的產物時,他們的幻想破滅了

當數百人得知他們所愛的女孩是人工智慧的產物時,他們的幻想破滅了

名為 u/LegalBeagle1966 的 Reddit 用戶是眾多迷戀 Claudia 的用戶之一,Claudia 是一個電影明星般的女孩,經常在這個平台上分享誘人的自拍照,甚至是裸體的。

又有12家潛力公司加入微軟「AI聯盟」。

又有12家潛力公司加入微軟「AI聯盟」。

微軟剛剛宣布,又有 12 家科技公司將參與其 AI for Good 計畫。

AI有血有肉再現七龍珠角色

AI有血有肉再現七龍珠角色

使用者@mortecouille92利用圖形設計工具Midjourney的力量,創建了著名龍珠角色的獨特逼真版本,如悟空、貝吉塔、布瑪和老龜。

改善 ChatGPT 反應的 7 種技巧

改善 ChatGPT 反應的 7 種技巧

只需添加一些條件或設定一些場景,ChatGPT 就可以為您的查詢提供更相關的答案。讓我們看看可以提高 ChatGPT 響應品質的一些方法。

驚嘆人工智慧繪製的精美畫作

驚嘆人工智慧繪製的精美畫作

Midjourney是一個人工智慧系統,最近在網路社群和藝術家界引起了“熱潮”,因為它的畫作極其精美,不遜色於真正的藝術家。