Create your VOD platform

To earn money with sharing your

tips
courses
webinars
tests

Scroll down for more

mouse arrow
blog

W jaki sposób sztuczna inteligencja może wpłynąć na przyszłość filmów?



Na co dzień posługujemy się schematami myślowymi powstałymi na bazie wcześniejszych doświadczeń. Pozwalają nam one na szybko wnioskować o następstwie przyszłych wydarzeń. Wskazówki zegara zawsze przesuną się w prawo, a pociąg prędzej czy później odjedzie ze stacji. Na podobnej zasadzie, dzięki uczeniu maszynowemu, przewidywać mają algorytmy sztucznej inteligencji. W jaki sposób wiąże się to z przyszłością wideo?

Algorytm generujący wideo

Badacze z uniwersytetu MIT opracowali niedawno algorytm uczenia maszynowego, potrafiący przewidzieć dalszy ciąg sceny i stworzyć jej wideo kontynuację na bazie jednego obrazka.

„Te wideo pokazują nam jak komputer prognozuje dalszy ciąg sceny”powiedział Carl Vondrick, doktorant MIT i autor algorytmu. „Jeśli możesz przewidzieć przyszłość, musiałeś zrozumieć coś co wydarza się w teraźniejszości”.

Algorytm uczył się z około 2 milionów filmów, obejmujących rok materiałów wideo. Następnie pozwolono mu generować kolejne sceny filmików, których realizm poddawany był ocenie ludzi.

Dwie sekundy filmu na podstawie obrazka

Omawiany algorytm tworzy kolejne klatki wideo symultanicznie. Dwusekundowa symulacja sceny powstaje więc właściwie w jednym momencie (32 klatki na sekundę). Proces jest przez to bardziej skomplikowany, ale pozwala na znacznie bardziej precyzyjne predykcje.

Algorytm potrafi osobno rozpoznawać obiekty oraz tło wideo. Na tej podstawie wie, które z elementów obrazka powinien przemieścić w następnych sekundach generowanej scenki, a które pozostawić w niezmienionej pozycji. Model mierzy się jeszcze z pewnymi problemami w tym temacie, związanymi z ruchem i rozmiarem obiektów. Jednakże, na przykład po zanalizowaniu obrazka plaży i morza, potrafiłby już animować widoczne na nim morskie fale.

Uczenie maszynowe w praktyce

Nauka algorytmu polega na swego rodzaju konkurencji między dwoma sieciami neuronowymi. Jedna generuje wideo, a druga próbuje rozpoznać, które wideo jest prawdziwe, a które sztucznie wygenerowane. Pierwsza ma więc za zadanie nauczyć się jak oszukać drugą.

Największym ograniczeniem algorytmu pozostaje czas wytwarzanych przez niego symulacji wideo, czyli około 1,5 sekundy. Wynik ten ma polepszyć się wraz z pracami nad systemem. Wyzwaniem dla badaczy pozostanie sprawa zachowania ciągłości i sensu generowanego filmu w kolejnych klatkach. Im dłuższa symulacja, tym o to trudniej.

Ruchome zdjęcia

Technologia ta może zostać wykorzystana chociażby w autonomicznych samochodach lub kamerach bezpieczeństwa przewidujących niebezpieczne zdarzenie zanim jeszcze ono nastąpi. Ciekawym rozwiązaniem wydawałoby się także wprawienie w ruch niektórych elementów tradycyjnych fotografii, wzorem tych z serii filmów o Harrym Potterze. Z podobnymi, wykorzystującymi algorytmy rozwiązaniami mamy do czynienia już teraz – w wykorzystującym filtry Snapchacie, wykrywającym twarze Facebooku czy w hollywoodzkich filmach, w których na zbliżonych zasadach odbywa się generowanie niektórych efektów specjalnych.

Autor: Jakub Mirek

Źródło:
news.mit.edu
www.theverge.com

Zapisz się i otrzymuj od nas informacje o nowościach oraz podpowiedzi z zakresu tworzenia i zarządzania swoją platformą VOD!

security

Twoje dane są bezpieczne. Nie udostępniamy Twojego adresu e-mail,
wykorzystujemy go tylko i wyłącznie do komunikacji w sprawie platformy myVOD.io!

Nasza strona internetowa używa plików cookies (tzw. ciasteczka) w celach statystycznych, reklamowych oraz funkcjonalnych. Dzięki nim możemy indywidualnie dostosować stronę do twoich potrzeb. Czytaj więcej...

Akceptuję