Techniques used to analyse data are producing misleading and often wrong results, critics say.
A growing amount of scientific research involves using machine learning software to analyse data that has already been collected. This happens across many subject areas ranging from biomedical research to astronomy. The data sets are very large and expensive.
But, according to Dr Allen, the answers they come up with are likely to be inaccurate or wrong because the software is identifying patterns that exist only in that data set and not the real world.
Egyre több, és egyre drágább adat kell a tudományos kutatásokhoz. A rengeteg adatot “okos” gép, mesterséges intelligencia dolgozza fel, elemzi. Ez sok fontos problémát okozhat.
Az egyik legfontosabb a kísérlet megismételhetősége. Ez alapelve (lenne) minden tudományos kutatásnak. Fontos, hogy a vizsgálatot mások is meg tudják ismételni. Ez az egyetlen valódi ellenőrzési módszere a tudományos eredményeknek. Amit nem lehet megismételni, az tudományos értelemben nem is létezik; nem tudjuk, hogy nem tévedés-e, vagy nem hamisítás-e. Ehhez kapcsolódóan állítja egy elemzés, hogy az orvosbiológiai kutatások 85%-a elvesztegetett pénz és idő.
A tanuló algoritmusok feladata az, hogy jelenségeket, mintázatokat fedezzenek fel óriási adathalmazokban. És fel is fognak fedezni valamit, ha már ezt a feladatot kapták! Vajon ez valódi tudományos eredmény? Olyan, amit más nagy adathalmazok is igazolni fognak, vagy csak ennek a halmaznak egy sajátossága? Megismételhető a kutatás ugyanezzel az eredménnyel? A szerző szerint általában nem.
Az AAAS (American Association for the Advancement of Science) konferenciáján dr. Genevera Allen (Rice University, Houston) beszélt erről a problémáról.
Tagja egy orvosbiológiai kutatócsoportnak, ami a gépi tanulás és a statisztika olyan új módszerét akarja kifejleszteni, ami segít a fenti problémák kezelésében. Az a cél, hogy az algoritmus értékelje az eredmény megbízhatóságát és a kutatás megismételhetőségét.
Érdekes és fontos cél! Ha megvalósul, magasabb szintre emeli a gépi tanulást. A gép egyben ellenőrizni is tudja majd magát.
Mostanában egyre többször vádolják elfogultsággal az okos gépet, pedig csak az általa felhasznált adatokra támaszkodik – azokban van téves (elfogult) kép.
Ez a törekvés összhangban van azzal a nemrég megfogalmazott igénnyel is, hogy legyen érthető a mesterséges intelligencia működése, magyarázza el, hogy mit, miért, hogyan csinál (explainable artificial intelligence, XAI).
#AAAS #BBC #science #AI #artificialintelligence #science_crisis #ML #machinelearning