Artificial intelligence is getting its teeth into lip reading. A project by Google’s DeepMind and the University of Oxford applied deep learning to a huge data set of BBC programmes to create a lip-reading system that leaves professionals in the dust.
Itt a folytatás, amit tegnap ígértem.
Szintén az oxfordi egyetem, szintén Google (DeepMind), de most nem külön erre a célra készített felvételeket, hanem rendes BBC-műsorokat (köztük: Newsnight, BBC Breakfast és Question Time) használtak a kutatók. 5000 órányi (2010 és 2015 között felvett) műsort használtak a gép tanításában, majd 2016 márciusa és szeptembere között vizsgáztatták. A hibátlanul leírt szavak aránya 46,8% volt. Ez nem tűnik soknak, de a profi szakembernek csak a negyede (12,4%) jött össze.
A tanítás során azzal a problémával is találkoztak, hogy sok felvételen nem volt szinkronban a hang és a kép, akár másodperces csúszás is lehetett. Azt is meg kellett tanítani a gépnek, hogy küszöbölje ki az elcsúszás hatását.
Van még hova fejlődni, de mindenképpen imponáló a négyszeres pontosság!
#Google #Alphabet #DeepMind #OxfordUniversity #AI #artificialintelligence #mesterségesintelligencia #lipreading #BBC