Jump to content
Unity Insider Forum

Optimiertes Erstellen eines großen Suchbaums


Kokujou

Recommended Posts

aber bei einem Spiel ist das ja etwas komplexer. Tatsächlich benutze ich übrigens OpenCV aktuell für geometrische Szenenrekonstruktion. Das sit ein modul dass ich im Master studiere. Die pure hölle >.> Aber egal.

Bei einem Spiel weißt du ja nicht was richtig ist.Wie lernst du den Algorithmus dann an? Du hast ja praktisch nur 1 sicheres Ergebnis und das ist wenn du gewonnen bzw verloren hast. Oder falls es ein Patt gibt. Aber wir müssen ja die Zwischenzüge bewerten. Das hab ich nie so ganz verstanden.

Link zu diesem Kommentar
Auf anderen Seiten teilen

vor 16 Minuten schrieb Kokujou:

Dann nehmen wir als Beispiel ein Schachspiel. Da gibts nur gewonnen und verloren. wie kann man also sagen wenn man z.B. den Bauer in der 5. Runde 2 Felder vor setzt das das gut oder schlecht ist? das würde mich mal interessieren.

Du kannst die aktuelle Situation auf dem Spielfeld bewerten. Ich denke man kann für alle "Spielstände" eine allgemeine Bewertung ermitteln, die aussagt, wie gut deine eigene Stellung ist. Ob diese Bewertung "aussagekräftig" ist, daß steht dann auf einem anderem Blatt. Ich vermute man ermittelt dabei eine Bewertung für jede einzele Figur und erstellt dann eine Gesamtbewertung über alle Figuren. Wie man eine solche Stellungsbewertung für Schach erstellt, da bin ich übergfragt, aber da gibt es bestimmt Formeln... Ich denke eine solche Bewertung ist am Anfang des Spieles sehr ungenau und wird immer besser, je weiter das Spiel fortschreitet.

Link zu diesem Kommentar
Auf anderen Seiten teilen

Aber es muss doch eine grundsätzliche Vorgehenweise zum Trainieren eines neuronalen Netzes geben oder?
Sagen wir mal du gibst einen Zustand ein also ein Schachfeld mit den korrespondierenden Figuren und den Positionen etc...

Ich weiß noch aus dem Unterricht dass es wohl ein rekursiver Algorithmus ist. Man spielt ein Probespiel und wenn die KI gewinnt gibts Pluspunkte wenn nicht Minuspunkte und +-0 bei Patt. Und dann muss sich der Algorithmus von dieser Basis aus irgendwie selbst abwickeln. Aber wie trainiert man ein neuronales Netz? ich meine bei einer Gewichtsanpassung muss man ja nur gewisse Werte anpassen, aber ein neuronales Netz ist doch deutlich komplizierter oder? Ich würde gerne wissen wie sowas funktioniert. das könnte man sicherlich auch gut in einer Master Arbeit verwenden.

Kennt ihr vielleicht irgendein primitives Spiel das mittels neuronalem Netz gelernt wird? Irgendwas einfaches wie Tic Tac Toe oder so, an dem man die generelle Vorgehensweise sieht.

Link zu diesem Kommentar
Auf anderen Seiten teilen

Ich neuronale Netz im Studium (ist schon eine Weile her). Du brauchst halt immer ein Eingabemuster (wie oben z.b. diese binäre Speicherung einer Schachstellung) und ein Ausgabemuster. Das Problem bei einem Schachspiel ist das Ausgabemuster. Ein neuronales System ist gut bei Erkennen von Mustern, dabei speichert es eine Abbildung aller Eingabemuster zu den Ausgabemustern als Gewichte seiner Neuronen. Leider ist eine Bewertung der Stellung eines Schachspieles ja "eigentlich" kein Muster. Was man aber machen könnte wäre folgendes: Du nimmst einen Profischachspieler und sagst diesem er soll jede einzelne Stellung eines Spieles bewerten. Diese Bewertung übergibst du nun dem neuronalem Netz als Lernsatz (Ausgabemuster). Wenn das neuronale Netz sagen wir mal 1000 Spiele auf diese Weise trainiert hat, kann es einigermaßen vernünftige Bewertungen einer Stellung abgeben. Mit dieser Methode hättest du dann eine Mischung aus neuronalem Netz für die Bewertung einer Stellung und einem Algorithmus der das Spiel als Baum auflöst (was wir oben diskutiert hatten).

Zum Thema primitives Spiel, du brauchst halt ein Spiel dessen Stellung du selbst gut bewerten kannst. Beispielsweise "4 gewinnt" oder so.

Link zu diesem Kommentar
Auf anderen Seiten teilen

Naja wir müssen uns überlegen wie wir das Spiel dazu befähigen zu lernen. anders gesagt wir lernen ja indem wir erstmal Spielen. Wenn wir verloren haben heißt das das wir schlecht gespielt haben. Dann hat man die Möglichkeit sich zu überlegen an welcher Stelle wir einen fehler gemacht haben im Spiel. Das wäre aber mit strategischem Wissen verbunden.

Was wir suchen wäre eher sowas wie: wenn man gewinnt bewerte alle von dir getätigten Spielzüge mit +100 und alle vom ggner auf -100, baue daraus ein neuronales netz und lasse dann mit diesem neuronalen netz gegen einen gegner spielen, je besser desto... besser. und dann passt sich das netz auf diese weise selbst an. Aber das ist nur theoretisch

Das größte Problem beim trainieren solcher Bäume ist die Anzahl der Durchläufe. Schach hat fast unbegrenzt viele Züge allein zu bewerten wann ein Spiel schachmatt ist ist überaus komplex. und die Anzahl der Schachzüge geht gegen unendlich. Also wäre das kein gutes Beispiel. Aber vielleicht gibt es ja solche Algoirthmen für einfachere Spiele. 4Mich wrüde eben interessieren ob es Ideen zur Umsetzung von neuronalen Netzen bei Spielen gibt deren Zustände nicht ohne weiteres bewertet werden können.

Bei 4 gewinnt würdest du wohl einen zustand danach bewerten wie viele Teile in einer Reihe sind und würdest damit warscheinlich verlieren. Denn du musst ja gleichzeitig die Gegnersteine minimieren. und dann irgendeine strategie aufbauen sodass der Gegner deine Steine nicht verbauen kann. netc...

Link zu diesem Kommentar
Auf anderen Seiten teilen

Archiviert

Dieses Thema ist jetzt archiviert und für weitere Antworten gesperrt.

×
×
  • Neu erstellen...