Home > Journal Artikel: „Deep Q-Network“ - Neuronales Netz, das selbst lernt und spielt

"Deep Q-Network" - neuronales Netz, das selbst lernt, spielt und gewinnt

12 April 2015 -John

Neuronales netzwerk

DeepMind von Google (ein britisches Unternehmen, dass sich auf die Programmierung der künstlichen Intelligenz spezialisiert) hat einen Algorithmus für künstliche Intelligenz entwickelt , der ziemlich alles selbst lernen kann. Seiner große Leistung ist es, die Beherrschung von 49 alten Atari Arcade Spiele, darunter "Space Invaders" und "Pac-Man". Als Maschine, die Fortschritte machen lernt, ist das größte Potential die Gefahr zu mildern, die den größten Schaden zufügen kann.

Forscher an der "DeepMind" einer Tochtergesellschaft von Google, haben einen künstliche neuronales Netzwerk vorgestellt, das "deep Q-network" (DQN) heißt und in der Lage ist selbst Computerspiele zu lernen und zu spielen, was neulich mit 49 klassischen Atari-Spielen präsentiert wurde.

Der DQN-Algorithmus, dessen Spielniveau in mehr als die Hälfte der Spiele, sich bei mehr als 75 Prozent von dem des professionellen Spieler befindet, kann weitsichtige Strategien entwickeln, die es erlauben die maximal erreichbare Punkte in bestimmten Spielen wie "Breakout" zu erreichen. Es hat damit die frühere Methode des maschinellen Lernens mit 43 Spielen überholt.

In Anbetracht von rohen Bildschirmpixel, dem Satz von verfügbaren Aktionen und dem Spielstand, war DQN in der Lage hinaus von allen diesen Spiele zu funktionieren. "Es war nicht bedarfsgerecht auf die Logik der Atarii-Spiele zugeschnitten, es ist ein spezielles, sehr praktisches und nützliches Versuchsfeld", sagte Demis Hassabasis der Vizepräsident des Engineering von Google DeepMind.

"Die Idee, die dahinten steckt ist, dass die zukünftige Versionen dieses Systems in der Lage sein sollten jede sequentielle Entscheidung zu generalisieren, auch, wenn die Eingangsdaten hoch-dimensional sind", sagte Demis dem TechNewsWorld Reporter.


Dieses Brettspiel gratis online spielen

Wie funktioniert DQN

Mehrere Features ermöglichen die Fähigkeit eines künstlichen neuronalen Netzwerkes mit skalierbaren Verstärkendem Lernen zu kombinieren, was zum erstem Mal in DQN eigesetzt wurde. Das Verstärkende Lernen (englisch RL - Reinforcement learning) ist ein Bereich des maschinellen Lernens, dass nicht die tatsächliche korrekte Eingang/Ausgangspaare oder explizit korrekte suboptimale Handlungen im Gegensatz zu Standard überwachen lernt. Es konzentriert sich darauf, ein Gleichgewicht zwischen der Neuland Erkundung und dem aktuellem Kenntnisstand zu finden. Mit anderen Worten, es ist eine "sinken oder schwimmen" Vorgehensweise.

Eine Eigenschaft, die "Erfahrung Wiedergabe" benannt wurde, hat eine Schlüsselrolle bei der Kombination zwischen Tiefem Neuronale Netzwerk oder DQN mit RL gespielt. DQN wurde mit einem Auswahl verschiedener Episoden, die aus einem gespeichertem Pool gezogen wurden, trainiert, ähnlich dem, was im Gehirn durch Rückblende oder Träume physisch realisiert wird. Das war entscheidend für den DQN Erfolg. Das deaktivieren dieser Eigenschaft führte zu der Verschlechterung der Leistung

Maschinen Rebellion?

Die Angst, dass die Maschinen unsere Welt übernehmen konnten ist nicht nur durch Science-Fiction Geschichten wie "Terminator" oder "Battlestar Galactica", sondern auch durch die Visionääre wie Stephen Hawkins, Elon Musk oder Bill Gates zum Ausdruck gebracht. Jedoch sie setzen sich für die die ungehinderte Forschung über künstliche Intelligenz ein.
Ironischerweise hatte Elon Musk bereites in "DeepMind" , das von Google im Jahr 2014 erworben wurde, gerade wegen seiner Sorgen über die Gefahren bei Forschung an der künstlicher Intelligenz investiert.

"Es sollte Wege geben, in dem es die Kontrolle über Künstliche Intelligenz durch den Menschen gebe", sagte in einer früherer Diskussion einem "TechNesWorld" Journalisten der Analyst von "Frost & Sullivan" Mukul Krishna. "Die Menschliche Welt ist äußerst nuanciert und es gibt so viele Abstraktionen, die nicht logisch sind".

Ähnliche Artikel