Autoflip, das neue KI-Modell von Google, kann Videos für jede Bildschirmgröße anpassen

Autoflip, das neue KI-Modell von Google, kann Videos für jede Bildschirmgröße anpassen

Sicherlich hat jeder von uns mehr oder weniger die Situation erlebt, dass der Bildrahmen eines Videos „gezackt“ ist, wenn man es auf einem mobilen Gerät ansieht. Verärgerung und Ärger sind wahrscheinlich Gefühle, die sofort auftauchen, aber man muss es trotzdem akzeptieren und sich das ganze Video ansehen, weil man einfach nichts anderes tun kann.

Um dieses scheinbar kleine Problem zu lösen, das jedoch große Auswirkungen auf die Benutzererfahrung hat, hat das KI-Forschungsteam von Google erfolgreich eine Open-Source-Lösung namens Autoflip entwickelt, die Videos automatisch so optimieren kann, dass sie sich an ein bestimmtes Gerät oder eine bestimmte Bildschirmgröße in einer Vielzahl von Bereichen anpassen Modi wie Querformat, Quadrat, Porträt usw.

Autoflip, das neue KI-Modell von Google, kann Videos für jede Bildschirmgröße anpassen

Grundsätzlich funktioniert Autoflip in drei Hauptphasen: Szenenerkennung, Videoinhaltsanalyse und schließlich Feinabstimmung.

In der Szenenerkennungsphase schenkt das maschinelle Lernmodell dem Punkt große Aufmerksamkeit, bevor es von einer Szene zur anderen schneidet oder springt. Dadurch kann ein Frame mit dem vorherigen Frame verglichen werden, um Farbänderungen und damit verbundene Elemente zu erkennen.

Autoflip, das neue KI-Modell von Google, kann Videos für jede Bildschirmgröße anpassen

Nachdem eine Benchmark-Aufnahme identifiziert wurde, analysiert das KI-Modell den Videoinhalt, um wichtige Objekte in einer Szene zu identifizieren. Zu diesem Zweck wird Autoflip ein Deep-Learning-Neuronales Netzwerk verwenden, das dabei hilft, nicht nur in der Szene erscheinende Objekte wie Menschen, Tiere, Fahrzeuge, Bäume ... eindeutig zu identifizieren, sondern auch deren Bewegung und Bewegungszustand Objekt.

Im letzten Schritt bestimmt das KI-Modell, ob es den stationären Modus für Szenen verwenden soll, die in einem einzelnen Raum stattfinden, oder den Tracking-Modus, wenn sich interessierende Objekte ständig bewegen. Basierend auf diesem Faktor und der Zielgröße, die das Video anzeigen muss, schneidet Autoflip den Anzeigerahmen zu, um eine flüssige Darstellung zu gewährleisten und insbesondere alle interessanten Inhalte beizubehalten.

Autoflip, das neue KI-Modell von Google, kann Videos für jede Bildschirmgröße anpassen

Laut KI-Forschern von Google können mit Autoflip Videos ohne menschliches Eingreifen in verschiedene Formate und Bildschirmgrößen konvertiert werden. Im nächsten Schritt möchte das Team die Fähigkeit von Autoflip verbessern, Themen in Interviews und Cartoons zu verfolgen. Dazu muss das KI-Modell mit Techniken zur Erkennung verschwommener Bilder und Texte ausgestattet werden, um Vorder- und Hintergrundobjekte besser in einem Rahmen zu platzieren.

Den Autoflip-Code finden Sie HIER .


Die ChatGPT-Task Force wird von Europa eingerichtet

Die ChatGPT-Task Force wird von Europa eingerichtet

Das Gremium, das die nationalen Datenschutzbeauftragten Europas vereint, gab am Donnerstag bekannt, dass es eine Task Force für ChatGPT eingerichtet habe

KI sagt den Zeitpunkt des menschlichen Todes mit einer Genauigkeit von 78 % voraus

KI sagt den Zeitpunkt des menschlichen Todes mit einer Genauigkeit von 78 % voraus

Dänische und amerikanische Wissenschaftler haben gemeinsam ein KI-System namens life2vec entwickelt, das den Zeitpunkt des menschlichen Todes mit hoher Genauigkeit vorhersagen kann.

KI sagt Harnwegserkrankungen allein durch das Geräusch des Urins voraus

KI sagt Harnwegserkrankungen allein durch das Geräusch des Urins voraus

Ein KI-Algorithmus namens Audioflow kann auf das Geräusch des Urinierens hören, um abnormale Urinflüsse und entsprechende Gesundheitsprobleme des Patienten effektiv und erfolgreich zu identifizieren.

Barkeeper aufgepasst: Dieser Roboter mixt einen Cocktail in nur 1 Minute

Barkeeper aufgepasst: Dieser Roboter mixt einen Cocktail in nur 1 Minute

Japans alternde und schrumpfende Bevölkerung hat dazu geführt, dass dem Land eine erhebliche Zahl junger Arbeitskräfte fehlt, insbesondere im Dienstleistungssektor.

Hunderte Menschen waren desillusioniert, als sie erfuhren, dass das Mädchen, das sie liebten, ein Produkt der KI war

Hunderte Menschen waren desillusioniert, als sie erfuhren, dass das Mädchen, das sie liebten, ein Produkt der KI war

Ein Reddit-Benutzer namens u/LegalBeagle1966 ist einer von vielen Benutzern, die in Claudia verliebt sind, ein Mädchen wie ein Filmstar, das auf dieser Plattform oft verführerische Selfies, sogar nackte, teilt.

12 weitere potenzielle Unternehmen treten der „AI Alliance“ von Microsoft bei.

12 weitere potenzielle Unternehmen treten der „AI Alliance“ von Microsoft bei.

Microsoft hat gerade angekündigt, dass zwölf weitere Technologieunternehmen an seinem AI for Good-Programm teilnehmen werden.

Die KI erschafft Dragon Ball-Charaktere aus Fleisch und Blut

Die KI erschafft Dragon Ball-Charaktere aus Fleisch und Blut

Benutzer @mortecouille92 hat die Leistungsfähigkeit des Grafikdesign-Tools Midjourney genutzt und einzigartig realistische Versionen berühmter Dragon Ball-Charaktere wie Goku, Vegeta, Bulma und Elder Kame erstellt. .

7 Techniken zur Verbesserung von ChatGPT-Antworten

7 Techniken zur Verbesserung von ChatGPT-Antworten

Durch einfaches Hinzufügen einiger Bedingungen oder Einrichten einiger Szenarien kann ChatGPT relevantere Antworten auf Ihre Fragen geben. Schauen wir uns einige Möglichkeiten an, wie Sie die Qualität Ihrer ChatGPT-Antworten verbessern können.

Bewundern Sie die wunderschönen Gemälde, die von künstlicher Intelligenz gezeichnet wurden

Bewundern Sie die wunderschönen Gemälde, die von künstlicher Intelligenz gezeichnet wurden

Midjourney ist ein künstliches Intelligenzsystem, das aufgrund seiner äußerst schönen Gemälde, die denen echter Künstler in nichts nachstehen, in letzter Zeit in der Online-Community und der Künstlerwelt für „Fieber“ gesorgt hat.

Dieses KI-Modell war einer der ersten „Experten“, der Neuigkeiten über den Ausbruch der Wuhan-Lungenentzündung entdeckte.

Dieses KI-Modell war einer der ersten „Experten“, der Neuigkeiten über den Ausbruch der Wuhan-Lungenentzündung entdeckte.

Tage nachdem China den Ausbruch bekannt gegeben hatte, konnte das KI-System von BlueDot mit Zugriff auf weltweite Flugscheinverkaufsdaten die Ausbreitung des Wuhan-Corona-Virus nach Bangkok, Seoul, Taipeh und Tokio weiterhin genau vorhersagen.