collaboration
9.8K views | +0 today
Follow
Your new post is loading...
Your new post is loading...
Scooped by Pál Kerékfy
Scoop.it!

Még ügyesebben olvas szájról a gép!

Még ügyesebben olvas szájról a gép! | collaboration | Scoop.it

Artificial intelligence is getting its teeth into lip reading. A project by Google’s DeepMind and the University of Oxford applied deep learning to a huge data set of BBC programmes to create a lip-reading system that leaves professionals in the dust.

Pál Kerékfy's insight:

Itt a folytatás, amit tegnap ígértem.

 

Szintén az oxfordi egyetem, szintén Google (DeepMind), de most nem külön erre a célra készített felvételeket, hanem rendes BBC-műsorokat (köztük: Newsnight, BBC Breakfast és Question Time) használtak a kutatók. 5000 órányi (2010 és 2015 között felvett) műsort használtak a gép tanításában, majd 2016 márciusa és szeptembere között vizsgáztatták. A hibátlanul leírt szavak aránya 46,8% volt. Ez nem tűnik soknak, de a profi szakembernek csak a negyede (12,4%) jött össze.

 

A tanítás során azzal a problémával is találkoztak, hogy sok felvételen nem volt szinkronban a hang és a kép, akár másodperces csúszás is lehetett. Azt is meg kellett tanítani a gépnek, hogy küszöbölje ki az elcsúszás hatását.

 

Van még hova fejlődni, de mindenképpen imponáló a négyszeres pontosság!

 

#Google #Alphabet #DeepMind #OxfordUniversity #AI #artificialintelligence #mesterségesintelligencia #lipreading #BBC

No comment yet.
Scooped by Pál Kerékfy
Scoop.it!

The 5 Jobs Robots Will Take First

The 5 Jobs Robots Will Take First | collaboration | Scoop.it

Oxford University researchers have estimated that 47 percent of U.S. jobs could be automated within the next two decades. But which white-collar jobs will robots take first?

Pál Kerékfy's insight:

Milyen munkákat visznek el a robotok? Nem, nem a fizikai munkakörökről van szó! Viszik a "fehér galléros", sokat tanult emberek munkáját is!

#robot #munka #job #automation

No comment yet.
Scooped by Pál Kerékfy
Scoop.it!

Szájról olvasás - “okos” géppel

Szájról olvasás - “okos” géppel | collaboration | Scoop.it

A new paper from the University of Oxford (with funding from Alphabet’s DeepMind) details an artificial intelligence system, called LipNet, that watches video of a person speaking and matches text to the movement of their mouth with 93.4% accuracy.

Even professional lip-readers can figure out only 20% to 60% of what a person is saying.

Pál Kerékfy's insight:

Itt egy újabb példa arra, hogy a mesterséges intelligencia tud jobb munkát végezni, mint a tapasztalt szakemberek. Az oxfordi kutatók által létrehozott LipNet alig hibázott a szájról olvasásban, míg a gyakorlott emberek hétszer annyi hibát követtek el.

 

Ami új ebben a szoftverben, az a szöveg feldolgozásának módja. A korábbi rendszerek szavanként értelmezték az ajkak mozgását, itt egész mondatokkal foglalkoznak – ez segít a kontextus megértésében.

 

Fontos megjegyzés: Rövid és jó minőségű felvételeket használtak. Zavaró körülmények esetén korántsem ennyire jók az eredmények. Ahhoz, hogy használható legyen (például nagyotthallók számára) még van mit fejleszteni rajta.

Továbbá: Két évvel ezelőtti a cikk, vagyis maga a fejlesztés és a tesztelés még régebben történt. Jön majd újabb is...

 

#OxfordUniversity #LipNet #Google #DeepMind #Alphabet #lipreading

No comment yet.