Vraag:
Een puur zelfgetrainde schaak-AI
thb
2012-07-07 07:38:05 UTC
view on stackexchange narkive permalink

Voor zover ik begrijp, lijkt het erop dat alle sterke schaaksoftware, voordat ze worden verplaatst,

  1. duizenden of miljoenen mogelijke toekomstige posities onderzoekt;
  2. elke toekomstige positie evalueert volgens een heuristiek, een evaluatiefunctie genoemd;
  3. evalueert afzonderlijk elke toekomstige positie voor rust om te beslissen of voortzettingen van de positie moeten worden onderzocht;
  4. kiest uit beschikbare zetten door minimax; en
  5. gebruikt een openingsboek.

Tot zover, zo goed. De sterkte van een schaakprogramma lijkt echter vooral af te hangen van de kwaliteit van de evaluatie- en rustheuristiek ervan - en ook van het openingsboek dat, vanuit het perspectief van de computer, weer een andere heuristiek is. Zo'n schaakprogramma weet alleen blijkbaar precies zoveel over het spel als de mens die de heuristieken heeft gemaakt. Het programma lijkt zelf geen inzichten te hebben.

Heeft iemand ooit een schaakprogramma geschreven dat wel zijn eigen inzichten heeft? Dat leert het spel op zichzelf? Dat traint zichzelf? Zo'n programma zou natuurlijk voorzien zijn van de regels van het spel en zou vermoedelijk verder worden voorzien van ruwe minimax- en rustinfrastructuur, en zou in staat zijn om een ​​gedwongen partner te herkennen en te vervolgen als hij er een zou vinden. Er zouden echter geen heuristieken worden verstrekt. Er zou bijvoorbeeld niet worden verteld om het spel naar het centrum te openen, noch om torens te verkiezen boven ridders, noch wat de Siciliaanse verdediging is. Het zou dergelijke principes zelf moeten afleiden (of, denkbaar, om betere principes te ontdekken).

In zijn pure vorm zou een dergelijk programma nooit master-games krijgen om te studeren, maar alleen zijn eigen games , speelde tegen zichzelf. Pas als het volledig zelfgetraind is, zou het worden losgelaten op menselijke concurrentie.

Bestaat er zo'n pure schaak-AI? Is er ooit een mechanisch schaakautodidact verschenen? Kan de oude Turk het zichzelf inderdaad leren?

Hier lijkt een korte kennisgeving te zijn van een pure schaak-AI die faalde.

( Een tangentieel gerelateerde vraag is eerder verschenen op deze site , met betrekking tot de geautomatiseerde studie van schaakopeningen.)

UPDATE

De vraag wordt opgeluisterd door drie verschillende, verhelderende antwoorden op het moment van schrijven, door @WesFreeman, @GregE. en @Landei. Alle drie worden sterk aanbevolen en ik ga me schuldig voelen als ik, volgens het sitebeleid, formeel een accepteer met uitsluiting van de andere. Ik wil hier mijn dank uitspreken voor en mijn waardering uitspreken voor alle drie.

Vragen willen beknopt zijn. Een reactie op antwoorden kan echter langer duren. De geïnteresseerde lezer kan daarom direct vanaf hier naar de antwoorden springen en, als hij nog steeds geïnteresseerd is, terugkeren om de langere update die volgt te lezen.

Toen ik de vraag stelde, had ik zoiets als het volgende in gedachten .

Stel je voor een hypothetisch dorp aan de rand van Shangri-La, waar de mensen nog nooit van schaken hebben gehoord. Tijdens je korte bezoek leer je de dorpsoudsten de regels van het spel, maar leer je ze nooit de principes van het spel. Twee van de oudsten spelen een spel terwijl de rest van de oudsten toekijkt, terwijl jij (die het spel niet wilt verstoren door te kibitzen) je commentaar beperkt tot vragen over de regels. Er volgt geen postmortem tijdens het spel, noch wordt schaken gespeeld of opnieuw besproken terwijl u in Shangri-La blijft. Als u echter vertrekt, om nooit meer terug te keren, laat u uw schaakspel achter.

Tijdens uw afwezigheid leren de oudsten het spel aan de mensen. Sommige mensen spelen later een beetje tijdens hun vrije tijd, een paar met groeiend enthousiasme, die hun eigen schaaksets maken.

Het is voor zulke dorpelingen misschien niet meteen duidelijk dat een toren beter was dan een ridder, maar de mensen kunnen nog steeds geleidelijk de relatieve sterke punten van de schaakstukken berekenen tijdens het spelen van veel partijen. Evenzo is het misschien niet meteen duidelijk voor hen dat 1. a4 een slechte opening was: ze konden het maar proberen en de resultaten overwegen.

In hoeverre zou het begrip van de dorpelingen van het spel uiteindelijk convergeren naar die van de buitenwereld? Kunnen ze bij gebrek aan een openingsboek zelf nieuwe openingen ontwikkelen? Natuurlijk zou je aanvankelijk niet verwachten dat de openingen van de dorpelingen erg goed zouden zijn, maar gezien een paar eeuwen isolement zouden de dorpelingen misschien een respectabel openingsrepertoire kunnen ontwikkelen, voor zover ik weet.

Zou een van hun openingen, onafhankelijk ontwikkeld, interessant blijken te zijn voor de buitenwereld, wanneer de volgende reiziger passeerde om er kennis van te nemen, 200 jaar later? Zou Shangri-La de wereld de nieuwe, roman Shangri-La Defense kunnen geven?

Zo ja, dan, met betrekking tot mijn oorspronkelijke vraag over schaak-AI, was wat ik in gedachten had min of meer dit: zou een schaak-AI de schaakvoortgang van de dorpelingen aan de rand van Shanrgi-La min of meer kunnen dupliceren?

Gezien het verhaal van Sussman in het antwoord van @ Landei hieronder, is het ongetwijfeld waar dat mijn dorpelingen bepaalde vooroordelen in het spel zouden brengen. Ze zouden bijvoorbeeld tot het inzicht brengen dat het bezitten van meer van iets nuttigs in het algemeen beter is dan er minder van bezitten, en dat het daarom waarschijnlijk te verkiezen was om de schaakstukken van een tegenstander te verslaan, boven het lijden van de eigen. Hoe territoriaal de fictieve mensen van Shangri-La van nature waren, is een vraag voor literatuur, maar men kan aannemen dat zij een positie die meer ruimte afdwong als superieur zouden erkennen aan een positie die minder dwong. En elke slimme beginneling die eenmaal een schaakspel heeft getoond en geïnstrueerd is in de spelregels, kan concluderen dat een dame waarschijnlijk beter is dan een pion, simpelweg doordat de dame maximaal 27 zetten beschikbaar heeft, terwijl de pion niet meer dan vier heeft - - en bovendien, door speculatieve gevolgtrekkingen tegen het ontwerp van het spel, door de observatie dat een speler begint met minder vrouwen dan pionnen.

Mijn vraag hoeft daarom niet te worden uitgelegd als een absoluut bevel in Sussman-stijl tegen het brengen enige vorm van kennis aan het schaakbord; maar eerder om een ​​algemeen verbod te impliceren tegen vooropgezette, schaakspecifieke kennis. Per slot van rekening (afgezien van de kwestie van de evolutie van de spelregels lang geleden) werd er ooit in het verleden de eerste partij schaak gespeeld. Misschien heeft de eerste speler 1. a4 geopend; maar uiteindelijk leerde hij beter, en leerde hij zijn discipelen wat hij had geleerd; die op hun beurt meer hebben geleerd en meer hebben geleerd, generatie na generatie, om ons Kasparov te geven.

Zou een AI zoiets niet alleen in weken in plaats van eeuwen kunnen doen?

Plato zou sceptisch zijn, denk ik. Hume zou optimistischer zijn, maar de vraag moet niet langer alleen door de filosofie worden opgelost. We hebben nu elektronische computers waarmee we de propositie kunnen testen, en ik vroeg me af wat de stand van de AI-techniek was. De beste schaak-AI's op dit moment lijken door en door onintelligente expertsystemen te zijn die iedereen verslaan zonder intuïtief te voelen. Ik vroeg me af of iets bredere AI's die, in zekere zin, echt aan schaken denken, enig aanzienlijk succes hadden gehad bij het aanleren van het spel.

Ik begrijp dat het antwoord nee is, waarschijnlijk niet.

(De antwoorden zullen opmerken dat ik * nog geen antwoord * heb geaccepteerd. Dit komt omdat verschillende naar mijn mening * acceptatie * verdienen en ik aarzel om te kiezen. Ook worden er nog steeds nieuwe antwoorden gepost, dus * acceptatie * kan voorbarig zijn. Laat me zeggen dat ik elk van de antwoorden op prijs stel.)
Ik wil opmerken dat de meeste mensen dit niet kunnen (neem alleen de regels van het schaakspel en leid daaruit af dat het een goed idee is om te proberen het midden in de opening te controleren). Om dit op te lossen denk ik dat je algemene intelligentie op bovenmenselijk niveau moet oplossen.
Dit is eigenlijk een van de betere vragen op deze site.
Ik ben hier bij Remco: een mens die alleen is uitgerust met de regels van het schaakspel, zou moeite hebben om verder te komen dan het begrip op beginnersniveau. Het zal in ieder geval decennia duren voordat we zelfs dat soort storingen op een computer kunnen recreëren ... en het is hoe dan ook mijn verwachting, dat sterke AI nog ver weg is, maar een enorme verzameling zwakke AI's zou in de nabije toekomst in staat kunnen zijn om redelijk goed door de echte wereld te navigeren.
Het zou de regels van het schaken moeten kennen, en wat telt als winst / gelijkspel. Afgezien hiervan zou een GA het probleem moeten kunnen oplossen. Je zou geen menselijke intelligentie nodig hebben.
Wat maakt de huidige benaderingen niet-AI? De meeste bekende intelligentie is gebaseerd op leren en op vooraf gecodeerde instructies, je zou kunnen zeggen dat zelfs menselijke intelligentie onder deze categorie valt. Dus misschien vallen alle schaak-AI die is geschreven en zal worden geschreven, alleen onder deze categorie, het is alleen een kwestie van hoezeer we de evolutie ervan als onvoorspelbaar / oncontroleerbaar beschouwen. Lijkt op het AI-effect: https://en.wikipedia.org/wiki/AI_effect
Het lijkt erop dat het antwoord nu ja is, aangezien DeepMind zojuist onderzoek heeft uitgebracht naar een nieuwe, ultramoderne schaak-AI die ze vanaf nul hebben getraind (alleen zelf spelen, geen referentiespellen). https://arxiv.org/pdf/1712.01815.pdf
Als aanvulling op de opmerking van @Lalaland, denk ik dat het na 10 uur trainen de stokvis volledig verpletterde (niet zeker welke versie) alsof stokvis een beginner was. Vrijwel ongehoord in engine versus engine-spellen. Het lijkt erop dat alphago zero graag speelt in de stijl van Tal
'Zou een AI zoiets in een paar weken kunnen doen, niet in eeuwen? Waarschijnlijk niet.' Nou, je had in zekere zin gelijk ... Het duurde maar uren.
Een flink aantal spelers, zoals Capablanca, zouden het spel hebben ontdekt door het een keer te zien spelen. En vergeet niet dat Alpha Zero niets anders had om over na te denken.
@ArianaGrande: 72 trekkingen scoren in 100 spellen betekent niet dat SF er echt als een beginner uitziet! Even terzijde, ik had nog nooit gehoord dat Tal Go speelde ...
Om AlphaZero in actie te zien, volg http://lczero.org/ of speel op http://play.lczero.org/
@JunyanXu Leela (Lc0) is gebaseerd op het AlphaZero-onderzoek van DeepMind, maar is een open source gedistribueerd computerproject dat onafhankelijk is geschreven en niet wordt beheerd door Google. Ze leert en groeit nog steeds en doet het goed in de beste computerschaaktoernooien buiten het laboratorium van DeepMind.
Vijftien antwoorden:
#1
+29
Daniel B
2012-07-19 14:31:55 UTC
view on stackexchange narkive permalink

Je hebt een aantal zeer interessante punten. Ik heb een beetje ervaring met AI-onderzoek (mijn M.Sc. was op dit gebied), dus ik denk dat ik wat inzichten kan geven.

Onderzoek in het gebied

Ten eerste is er zeker onderzoek op dit gebied - het zoeken naar 'evolutionary approach chess' kwam terug met dit artikel uit 2001, waarbij vrijwel precies werd gedaan wat je had voorgesteld, waarbij de min / max aanpak en alleen het wijzigen van de evaluatiefunctie. Het is mogelijk om er nog veel meer op te graven, en ik ken verschillende mensen die in het algemeen op dit gebied werkten.

Theoretische mogelijkheden

Naar mijn mening is de enige echte beperkende factor voor het creëren van een "pure" schaakspel-AI de rekentijd. Er is absoluut geen reden waarom een ​​dergelijke AI theoretisch niet kan worden gecreëerd met de huidige benaderingen.

Praktijken

Er zijn twee hoofdproblemen bij het gebruik van evolutionaire of genetische benaderingen bij het ontwikkelen van een heuristische schaakfunctie, de eerste is dat zelfs in de meest elementaire, een heuristische functie voor schaken is enorm complex. We hebben het over honderden regels, stukwaarderingen (die kunnen verschillen op basis van positie, enz.), Positieanalyses, enz. Je hebt een flexibele computertaal nodig om deze regels te beschrijven, en dan kunnen deze regels willekeurig worden gegenereerd, gemuteerd, met elkaar gefokt, enz. Het is zeker mogelijk, maar ik vermoed dat je een set regels zou krijgen die uit enkele duizenden entiteiten bestaat. Dat is een zeer grote regelset om dynamisch te evolueren.

Het tweede probleem is dat je, om je zojuist gewijzigde regel daadwerkelijk te evalueren, een spelletje schaak moet spelen en moet zien wie er uiteindelijk wint. Als je dit "correct" wilt doen, moet je beide spelers voldoende tijd geven om na te denken, iets wat lijkt op een typische spelduur. Het spelen van slechts één tegenstander is echter niet genoeg, je zou veel verschillende tegenstanders willen spelen, en misschien zelfs dezelfde tegenstanders, vaak, voordat je er echt van overtuigd kunt zijn dat je een verbetering in spelsterkte hebt gevonden. Dit zou waarschijnlijk betekenen dat je een paar honderd spellen per persoon in je populatie moet spelen, en dat geeft je één generatie van je algoritme.

Typisch met dit soort benaderingen, zou je kijken naar ten minste enkele honderden generaties, of met zulke complexe functies als een schaakheuristiek, enkele honderdduizenden (of zelfs miljoenen) generaties. Een paar snelle rekensommen zouden u ervan moeten overtuigen dat u enkele duizenden uren CPU-tijd nodig heeft voor een enkele generatie, zelfs als u dit uit een serverfarm van aanzienlijke omvang schaalt, zult u waarschijnlijk enkele (mogelijk honderden) jaren nodig hebben om daadwerkelijk te evolueren, precies zoals je vermeldt in je update.

Aan het einde van die tijd zou je een interessant algoritme hebben dat waarschijnlijk heel veel inzichten in het spel zou hebben die nooit echt zijn ontdekt. Het is moeilijk te zeggen of ze nuttig of zelfs begrijpelijk zouden zijn voor mensen. Waarom bestaat deze regel? Omdat het meer dan duizenden spellen leek te werken.

Toekomst

Ik twijfel er niet aan dat deze benaderingen meer aan populariteit zullen winnen naarmate de rekenkracht toeneemt. Momenteel zijn we op een punt waar een machine net genoeg rekentijd heeft om (bijna alle) mensen te verslaan, als de intelligentie zorgvuldig met de hand is gemaakt. Over 20 jaar is het heel goed mogelijk dat processors zo ver zijn gegaan dat een of twee extra bewegingen in de diepte de 'hardgecodeerde' machines niet langer genoeg voordelen bieden, maar routinematig worden verslagen door geëvolueerde, vreemd intuïtieve machines die miljoenen uren evolutie achter de rug.

Update 2018 mei

Zoals Robert Kaucher in een opmerking hieronder vermeldt, verdient recent nieuws hier een vermelding. In het bijzonder lijkt het AlphaGo-project van Google de eerste echt levensvatbare op AI-gebaseerde benadering van dit soort games te zijn, en beweert eind 2017 te hebben gewonnen van StockFish 2, nadat het opnieuw was bedoeld voor de taak .

Dank je. Het valt me ​​op dat het papier dat je koppelt zijn AI eerst traint tegen niet-meester menselijke tegenstanders en later tegen bestaande schaaksoftware, wat niet helemaal is wat jij en ik in gedachten hadden. Een platonist als ik zou niet verbaasd zijn te horen dat het soort AI dat u en ik bespreken praktisch onmogelijk was (we weten dat het geen theoretische onmogelijkheid is omdat schaken in theorie kan worden opgelost met minimax); maar of een antwoord mij verbaast, is niet het punt. Punt is om te vragen of een AI de voorgestelde prestatie heeft bereikt. Het antwoord lijkt nee te zijn.
@thb Ik denk dat er een behoorlijk aantal pogingen zijn gedaan om dit type AI te gebruiken, hoewel je ze als "niet succesvol" zou kunnen beschouwen. Ik vermoed dat een enorm succesvolle poging (vandaag) waarschijnlijk op een zeer zwak amateurniveau zou spelen; een geweldige prestatie, alleen niet in de ogen van het publiek. Ik denk ook niet dat training tegen bestaande programma's en mensen op zich vals spelen is - slechts een zeer grote optimalisatie, zij het een die de richting van de speelstijl van de evoluerende AI kan veranderen.
Als u meer wilt lezen over de "pure" benadering, zult u waarschijnlijk meer geluk hebben bij het zoeken naar "competitieve co-evolutie" -benaderingen. Dit is de uitdrukking die wordt gebruikt als er geen goede manier is om een ​​externe prestatiemeting te geven (d.w.z. we kunnen niet tegen andere schaakengines spelen), dus de AI-training moet evolueren door verschillende versies van zichzelf te spelen. Het werkt zeker, maar duurt veel langer, wat waarschijnlijk de reden is waarom het een minder nagestreefde aanpak is.
@DanielB Is AlphaZero such an AI?
Misschien wilt u uw antwoord bijwerken. https://www.chess.com/news/view/google-s-alphazero-destroys-stockfish-in-100-game-match
@RobertKaucher (Sorry, ik ben een tijdje offline geweest) Ik ben het ermee eens dat dit een vermelding verdient, hoewel het onduidelijk is onder welke omstandigheden AlphaGo daadwerkelijk StockFish speelde. In het bijzonder werden veel van de bewegingen van StockFish direct na de aankondiging bestempeld als flagrante blunders, waardoor mensen zich afvroegen wat er aan de hand was. Desalniettemin is AlphaGo in het algemeen serieus interessant, dus ik zal updaten.
#2
+17
Greg E.
2012-07-07 11:26:20 UTC
view on stackexchange narkive permalink

Ik vermoed dat wat je vraagt, wordt geclassificeerd als een soort genetisch algoritme of evolutionair algoritme -benadering. Ik vermoed dat er geen realistische manier is om een ​​dergelijk algoritme te ontwerpen zonder intrinsiek een zekere mate van menselijke vooringenomenheid op een fundamenteel niveau in te bedden, aangezien de programmeur nog steeds de statische kenmerken van een positie moet definiëren (materiaalaantal, pionnenstructuur, kleurcomplexen, enz.) volgens welke de AI posities van verschillende spellen zou classificeren en vergelijken. Als je op Google zoekt naar de bovenstaande algoritmische terminologie in de context van schaken, zul je talloze resultaten vinden, maar waarschijnlijk weinig serieus onderzoek dat daadwerkelijk is gebruikt om succesvolle, competitieve AI's te bouwen.

Feit is dat computers, als gevolg van de wet van Moore, nu zulke krachtige rekenmachines zijn dat extreem geavanceerde AI-methoden niet alleen overbodig zijn (in termen van spelen op een hoger niveau dan de beste menselijke tegenstanders), maar kan zelfs contraproductief zijn. Schaken is het soort spel waarin - voornamelijk vanwege de relatief kleine zoekruimte van redelijke zetten in een bepaalde positie en het bestaan ​​van gedwongen tactische combinaties (bestaande uit reeksen checks, stukken slaan, dreiging met mat of catastrofaal verlies van materiaal, etc.) - een brute-force benadering met wat conservatief snoeien in de zoekboom is tegelijkertijd de meest algoritmisch eenvoudige en de meest effectieve benadering. Als je rekening houdt met de beschikbaarheid van eindspel-tafels en openingsboeken, wordt de logica van die benadering alleen maar groter. Ik begrijp dat er nog steeds veel theoretische interesse en potentiële waarde is in het soort nieuwe AI waar je het over hebt, maar ik vermoed dat schaken de verkeerde arena is om het te ontwikkelen. Aan de andere kant is een game als Go, die van nature minder tactisch is en een veel grotere zoekruimte omvat die brute-force-benaderingen onpraktisch maakt, wellicht een betere kandidaat voor baanbrekend AI-onderzoek.

Ik heb de AI-vraag bijgewerkt in het licht van uw antwoord. De update is niet kort, dus naar uw keuze, als u wat tijd heeft, kunt u deze bekijken in hoeverre deze u interesseert.
Een dergelijke menselijke vooringenomenheid zou niet nodig zijn. Genereer eenvoudig 1000 willekeurige algoritmen die in staat zijn om legaal schaak te spelen, zet ze tegen elkaar in een toernooi, neem dan de top 20% en pas mutatie en crossover toe om de volgende generatie op te bouwen. Herhaal dit over een aantal populaties gedurende een aantal generaties en je zou aan het eind iets half fatsoenlijks moeten hebben. De enige fitnessfunctie die nodig is, is winnen / verliezen.
#3
+15
Jay Scott
2012-07-14 02:21:51 UTC
view on stackexchange narkive permalink

Zie de Wikipedia-pagina over Algemeen gamen. Het is een actief onderzoeksgebied. Er is een jaarlijks GGP-toernooi waarin programma's de regels van een nieuw spel krijgen, er een tijdje over nadenken en dan het spel tegen elkaar spelen.

Als je de regels van het schaken opgeeft. voor een GGP-programma, denk ik dat je zult merken dat het veel sterker speelt dan een menselijke beginner en veel zwakker dan een speciaal geschreven schaakprogramma.

#4
+15
ETD
2017-12-07 10:52:28 UTC
view on stackexchange narkive permalink

In het licht van het recente opvallende succes van AlphaZero tegen Stockfish 8 is het de moeite waard deze vraag opnieuw te bekijken. Een verdere evolutie van de AlphaGo en AlphaGo Zero-programma's van DeepMind, AlphaZero eindigde met een duizelingwekkende score van +28 = 72-0 tegen een van de sterkste "traditionele" schaakengines ter wereld.

AlphaZero leerde zichzelf spelen door middel van reinforcement learning en trainde zijn neurale netwerkarchitectuur door middel van een reeks games tegen zichzelf. Volgens het begeleidende artikel:

  1. De invoerfuncties die de positie beschrijven en de uitvoerfuncties die de beweging beschrijven, zijn gestructureerd als een reeks vlakken; d.w.z. de neurale netwerkarchitectuur is afgestemd op de rasterstructuur van het bord.
  2. AlphaZero is voorzien van perfecte kennis van de spelregels. Deze worden gebruikt tijdens MCTS, om de posities te simuleren die het resultaat zijn van een reeks zetten, om het beëindigen van het spel te bepalen en om simulaties te scoren die een terminale status bereiken.
  3. Kennis van de regels wordt ook gebruikt om de invoervlakken (dwz rokeren, herhaling, geen vooruitgang) en uitvoervlakken (hoe stukken bewegen, promoties en stukken vallen in shogi).
  4. Het typische aantal legale zetten wordt gebruikt om het verkenningsgeluid te schalen ( zie hieronder).
  5. Schaak- en shogi-spellen die een maximum aantal stappen overschreden (bepaald door de typische speelduur) werden beëindigd en kregen een gelijkspel toegewezen; Go-spellen werden beëindigd en gescoord volgens de Tromp-Taylor-regels, vergelijkbaar met eerder werk (29).

AlphaZero gebruikte geen enkele vorm van domeinkennis buiten de hierboven genoemde punten.

Ik weet zeker dat je vragen kunt stellen over zaken als de verschillende hardware die wordt gebruikt - " AlphaZero ... gebruikte een enkele machine met vier TPU's. Stockfish ... gespeeld op [zijn] sterkste vaardigheidsniveau met 64 threads en een hash-grootte van 1 GB. " - maar in elk geval is het resultaat van AlphaZero opmerkelijk, en heel erg in de trant van het OP.

Misschien nog meer steun onthullend voor hoe weinig domeinspecifieke kennis er in het spel was, naast het verslaan Stokvis in schaken, AlphaZero trainde ook bij shogi tot het punt van het verslaan van het kampioensprogramma Elmo, en overtrof natuurlijk ook zijn voorganger AlphaGo Zero in Go.

Hier is een van de wedstrijden tegen Stockfish, een Berlijn waarin de materiële onbalans is uiteindelijk AlphaZero met het loperpaar tegen een paard en 4 pionnen voor Stokvis na 31.Qxc7 . In die positie staan ​​alle stukken van AlphaZero op de achterste rij, met de bisschoppen weer op hun oorspronkelijke vakjes. Uiteindelijk, nadat de koninginnen loskomen, manoeuvreren de zwarte stukken langzaam om witte pionnen op te pakken, en dat zijn gordijnen.

  [fen ""] [Datum "2017.12.04"] [Witte "Stokvis" ] [Zwart "AlphaZero"] [Resultaat "0-1"] 1.e4 e5 2.Nf3 Nc6 3.Bb5 Nf6 4.d3 Lc5 5.Bxc6 dxc6 6.OO Nd7 7.Nbd2 OO 8.Qe1 f6 9.Nc4 Rf7 10.a4 Bf8 11.Kh1 Pc5 12.a5 Ne6 13.Ncxe5 fxe5 14.Nxe5 Rf6 15.Ng4 Rf7 16.Ne5 Re7 17.a6 c5 18.f4 Qe8 19.axb7 Bxb7 20.Qa5 Nd4 21.Qc3 Re6 22 .Be3 Rb6 23.Nc4 Rb4 24.b3 a5 25.Rxa5 Rxa5 26.Nxa5 Ba6 27.Bxd4 Rxd4 28.Nc4 Rd8 29.g3 h6 30.Qa5 Bc8 31.Qxc7 Bh3 32.Rg1 Rd7 33.Qe5 Qxe5 34.Nxe5 Ra7 35.Nc4 g5 36.Rc1 Bg7 37.Ne5 Ra8 38.Nf3 Bb2 39.Rb1 Bc3 40.Ng1 Bd7 41.Ne2 Bd2 42.Rd1 Be3 43.Kg2 Bg4 44.Re1 Bd2 45.Rf1 Ra2 46.h3 Bxe2 47 .Rf2 Bxf448.Rxe2 Be5 49.Rf2 Kg7 50.g4 Bd4 51.Re2 Kf6 52.e5 + Bxe5 53.Kf3 Ra1 54.Rf2 Re1 55.Kg2 + Bf4 56.c3 Rc1 57.d4 Rxc3 58.dxc5 Rxc5 59.b4 60.h4 Ke5 61.hxg5 hxg5 62.Re2 + Kf6 63.Kf2 Be5 64.Ra2 Rc4 65.Ra6 + Ke7 66.Ra5 Ke6 67.Ra6 + Bd6 0-1  
#5
+11
Eve Freeman
2012-07-07 10:16:58 UTC
view on stackexchange narkive permalink

Ik denk dat de belangrijkste reden waarom het moeilijk is om zo'n AI te produceren, is vanwege de benodigde ruimte voor het opslaan van de "training" om effectief te zijn.

Ook (als reactie op je opmerking over zelfstudie) kan zelftraining nadelig zijn als je probeert een dergelijke AI te verbeteren - ik heb wat onderzoek gedaan met boter-kaas-en-eieren (weliswaar veel eenvoudiger ), en het vond allerlei vreselijke manieren om te winnen (en die vreselijke manieren te trainen) omdat beide partijen vreselijk speelden. Het duurde veel langer om redelijke prestaties te krijgen met zelftraining dan trainen tegen een goed vooruitkijkende AI in boter-kaas-en-eieren.

Ik denk echter dat het interessant zou zijn om een ​​hybride te zien die gebruikmaakt van zowel diep zoeken als "training" - een soort opgeslagen database met posities voor middenspel (in plaats van alleen eindspel en openingen). Het zou veel ruimte nodig hebben.

Misschien denk je aan een meer "echte" AI-benadering die positionele concepten leert in plaats van positiewinst / verlies / gelijkspel, maar ik denk niet dat dat zou gebeuren zeer effectief zijn (in vergelijking met sterke motoren).

Het antwoord wordt gewaardeerd. Wat ik denk dat ik in gedachten had, was een AI die (a) een minimax-mogelijkheid bezat, maar (b) een vooraf bepaalde evaluatiefunctie miste. Zo'n AI zou noodzakelijkerwijs een zo klein spel als boter-kaas-en-eieren oplossen door pure minimax. Bij schaken, een spel dat alleen theoretisch vatbaar is voor minimax, evalueert de AI niet de huidige positie op het bord, maar toekomstige posities, waarna minimax de zet kiest. Het kan losjes worden gezegd dat Nimzowitsch een revolutie teweeg heeft gebracht in het schaken door bekende evaluatieheuristieken te verwerpen. Zo ja, zou een machine dan hetzelfde kunnen doen?
Dus je zegt dat het zijn eigen evaluatiefunctie zou ontwikkelen?
@thb, als programmeur denk ik dat het probleem met uw idee is dat, voor zover ik kan zien, geen enkele plausibele schaak-AI kan beginnen met een volledig lege lei voor een evaluatiefunctie. Je zou een AI kunnen schrijven die games analyseert op patronen en statistische / probabilistische methoden gebruikt (bijv. Bayesiaanse inferentie) om zijn waarderingen en besluitvorming te verfijnen, maar de programmeur moet identificeren welke motieven, positionele factoren en bewegingsreeksen de patronen vormen. en volgens welke criteria om ze te beoordelen. Met andere woorden, de basiskern van de evaluatiefunctie zou nog steeds door mensen ontworpen moeten zijn.
@WesFreeman: Dat klopt. Het zou zijn eigen evaluatiefunctie ontwikkelen. Merk op dat dit niet mijn eigen idee is, maar het lijkt te zijn wat de pure schaak-AI die in de oorspronkelijke vraag was gekoppeld, probeerde en niet deed.
@GregE .: Geen plausibele schaak-AI? Ik vermoed dat je gelijk hebt; want als je het bij het verkeerde eind had, zou zo'n AI inmiddels gemaakt zijn.
Het is misschien interessant om te zien wat een genetische minimax-engine bedenkt, bijvoorbeeld als je alle stukken zou beginnen met dezelfde materiële waarde, gebaseerd op winst / verlies / gelijkspel, en de materiële waarden zou laten muteren. Ik weet zeker dat engine-makers al hebben geprobeerd deze aan te passen, zoals het maken van ridders 2.9 en bisschoppen 3.1 pionnen.
@thb, Ik ben geen expert, maar ik denk dat dat het geval is. Zelfs de AI waarmee u verbinding heeft gemaakt, wordt beperkt door vooringenomenheid van de programmeur. Als je het originele onderzoeksdocument leest, merkt het op dat de "kenmerkvector" die de evaluatiefunctie traint, bordkenmerken omvatte die "zorgvuldig met de hand werden ontworpen". Dat wil zeggen, de programmeur moet nog steeds de reeks statische positionele factoren specificeren waarop de AI zijn besluitvorming baseert. Het grote voordeel van een neuraal netwerk voor dit specifieke project is, denk ik, dat de training kan worden parallel geschakeld, waardoor asynchrone verwerking van enorme hoeveelheden games efficiënt mogelijk is.
Ik heb de AI-vraag bijgewerkt in het licht van uw antwoord. De update is niet kort, dus naar uw keuze, als u wat tijd heeft, kunt u deze bekijken in hoeverre deze u interesseert.
#6
+10
Robert Kaucher
2012-07-09 19:26:46 UTC
view on stackexchange narkive permalink

Ik wil de antwoorden van Greg en Wes hier even toelichten. Het soort AI dat thb voorstelt, bestaat simpelweg niet met de verfijning die vereist is voor deze toepassing. En zelfs als ze dat zouden doen, vermoed ik dat ze hierin zouden falen. Het is alsof ze een sterke AI voor algemeen gebruik willen die de basisregels van het spel kan worden geleerd en vervolgens kan worden uitgezonden. Maar als je kijkt naar de AI's voor algemene doeleinden die in ontwikkeling zijn, krijgen ze allemaal dingen als object- en spraakherkenning onderwezen op het niveau van 1 tot 2 jaar oud. Elke AI voor algemene doeleinden zou eerst de verfijning moeten hebben om te kunnen begrijpen wat een game is, voordat hij zou kunnen begrijpen hoe een game moet worden gespeeld. Je kunt geen AI voor algemeen gebruik ontwerpen en verwachten dat deze presteert als een beperkte of gespecialiseerde AI. Een AI voor algemene doeleinden zou moeten worden geleerd schaken als een persoon en je kunt niet verwachten dat je twee beginnende spelers zonder kennis van de schaakgeschiedenis samenbrengt en spontaan openingen en strategische thema's opnieuw uitvindt. Er zouden vele honderden keren nodig zijn dat de AI elkaar zou spelen, elk met toegang tot de historische gegevens van al hun spellen gedurende vele honderdduizenden iteraties. En elke AI zou bepaalde specifieke kenmerken moeten hebben die op verschillende niveaus gewogen moeten worden.

Het kostte mensen bijna 500 jaar om van Rodrigo (Ruy) López de Segura en Pedro Damião naar Paul Morphy te komen en vervolgens de verdere veranderingen die plaatsvonden tussen het toneelstuk van Steinitz en Alekhine. En al die verandering vond plaats door de dynamiek van vele honderdduizenden spelers met verschillende temperamenten en andere beïnvloedende kenmerken (zoals het willekeurig bevoordelen van ridders boven bisschoppen of bisschoppen boven ridders) om nog maar te zwijgen van speelstijlen en modes. Al deze dingen hebben bijgedragen aan de dynamo van verandering die het schaken door de eeuwen heen heeft beïnvloed. Geen enkele zwakke AI - zelfs een zwakke AI voor algemeen gebruik - zou dat soort dynamo kunnen dupliceren omdat het verlangen ontbreekt. Alleen het verlangen kan ervoor zorgen dat iets gedurende vele dagen urenlang blijft zitten om een ​​opening te analyseren met de intentie om hem kapot te maken of te verbeteren nadat een rivaal hem heeft "kapotgemaakt". Het is echt dit soort drive voor analyse en voorbereiding dat het spel door de eeuwen heen verbeterde - niet het blind spelen van miljoenen spellen tussen even zwakke spelers.

Het is alsof je een stel mensen meeneemt die geen Engels spreken en die nooit de meesters in literatuur van hun moedertaal lezen en ze in een kamer plaatsen met boeken Engels als tweede taal en verwachten dat ze iets bedenken zoals de werken van Shakespeare. Het zal nooit gebeuren.

BEWERKEN : ik had beter moeten weten dan deze bewering te maken, want het is gebeurd.

"AlphaZero heeft het spel niet in de traditionele zin" geleerd "", legt Chess.com uit. 'Dat betekent geen openingsboek, geen eindspel-tafels en blijkbaar geen ingewikkelde algoritmen die minieme verschillen tussen middenpionnen en zijpionnen ontleden. Dit zou vergelijkbaar zijn met het feit dat een robot toegang krijgt tot duizenden metalen stukjes en onderdelen, maar geen kennis heeft van een verbrandingsmotor, en vervolgens talloze keren experimenteert met elke mogelijke combinatie totdat hij een Ferrari bouwt. … Het programma had vier uur om zichzelf vele, vele keren te spelen, waardoor het zijn eigen leraar werd. ”

Mijn voortdurende, duidelijk ongegronde blather:

We nemen het als vanzelfsprekend alle impliciete kennis die we hebben over de wereld. Om te kunnen begrijpen dat als ik stukken hout en een spijker heb, een hamer voor mij nuttiger is dan een schroevendraaier, moet ik eerst begrijpen dat bepaalde klassen van dingen in bepaalde situaties nuttiger zijn dan andere dingen. Ik moet ook begrijpen dat dingen een nut hebben dat op een doel kan worden toegepast. Dit zijn heuristieken. Als de AI niet kan worden verteld dat bepaalde stukken meer waarde hebben dan andere, hoe kan het dan überhaupt begrijpen wat mat is? Als het niet kan worden geprogrammeerd met specifieke heuristieken, moet het in staat zijn om deze ideeën zoals "waarde" en "nut" vormervaring te extrapoleren. En dat is niet het domein van narrow AI. Het is het domein van algemene, sterke AI.

Uitstekend antwoord. Ik denk dat je eerste alinea echt het idee kristalliseert dat ik probeerde over te brengen, maar dat met grotere helderheid doet.
Bedankt, Greg. Ik wil er alleen aan toevoegen dat ik het heb over een zwakke AI voor algemeen gebruik. Ik geloof dat een echte Strong AI zoiets zou kunnen doen via vele instanties over vele iteraties in een sterk gecomprimeerd tijdsbestek. Maar we hebben nog geen sterke AI. http://en.wikipedia.org/wiki/Strong_AI
Ik ben het eens met alles wat je zei, behalve het gedeelte over verlangen. AI kan urenlang zitten en doen wat de ontwerpers willen - genoeg computerkracht kan schaken oplossen, alleen hebben we nog niet genoeg kracht.
Dat is waar, Wes, maar dan injecteren we de bias van de 'programmeur' of wat dan ook in de AI; dat is een van de dingen die de auteur van de vraag niet wilde.
@EveFreeman, Ik denk dat u niet begrijpt wat ik zeg. Ik zeg niet dat computers schaken niet zullen "oplossen". Ik zeg dat het * specifieke * scenario van het OP zo verlamd is dat het niet zal werken. Als het systeem geen heuristieken heeft, hoe kan het dan een waarde toekennen aan stukken?
Creatieve onvruchtbaarheid van machines is naar verluidt bedrieglijk.
#7
+9
Landei
2012-07-08 01:27:00 UTC
view on stackexchange narkive permalink

Mediteer alstublieft over de volgende AI Koan:

In de dagen dat Sussman een beginner was, kwam Minsky eens naar hem toe terwijl hij zat te hacken op de PDP-6. “Wat ben je aan het doen?”, Vroeg Minsky. "Ik train een willekeurig bedraad neuraal net om Tic-Tac-Toe te spelen", antwoordde Sussman. “Waarom is het net willekeurig bedraad?”, Vroeg Minsky. "Ik wil niet dat het enige vooroordelen heeft over hoe te spelen", zei Sussman. Minsky sloot toen zijn ogen. “Waarom sluit je je ogen?”, Vroeg Sussman aan zijn leraar. "Zodat de kamer leeg zal zijn." Op dat moment was Sussman verlicht.

Onze applicaties hebben altijd vooroordelen, of je nu je ogen sluit of niet ...

Uw anekdote is zeer overtuigend. Voor zover het u interesseert, heeft uw anekdote mij ertoe aangezet de vraag uit te breiden met een update, die u hierboven kunt zien als u wat tijd heeft.
#8
+8
Erik Madsen
2017-12-04 01:56:36 UTC
view on stackexchange narkive permalink

Heeft iemand ooit een schaakprogramma geschreven dat wel zijn eigen inzichten heeft? Dat leert het spel op zichzelf? Dat traint zichzelf?

Ja. Bekijk de schaakengine Giraffe, geschreven door Matthew Lai. Hij schreef de schaakengine als onderdeel van zijn onderzoek naar kunstmatige intelligentie voor een master in computerwetenschappen.

Hierover was vorig jaar veel discussie op het schaakprogrammeerforum TalkChess. Ik weet het omdat ik een schaakmachine-auteur ben wiens motor ongeveer zo sterk is als Giraffe. Ik heb mijn engine echter geïmplementeerd met behulp van traditionele technieken, terwijl de auteur van Giraffe zijn engine heeft getraind met behulp van "temporeel verschil versterkend leren met diepe neurale netwerken." Matthew moest nog steeds de traditionele alfa / bèta-zoekactie implementeren om dynamisch een positie te evalueren, met andere woorden, om veel zetten vooruit te kijken. Zijn innovatie is het trainen van de motor om een ​​ statische positie te beoordelen. Ter vergelijking: ik schreef specifieke kennis in de statische evaluatieroutine van mijn engine.

Ik schreef code om evaluatieparameters af te stemmen met behulp van een deeltjeszwermalgoritme (zie de pagina Bedankt op mijn blog voor links tot technische discussie) die positieve resultaten opleverden - een sterkere motor. Dit was echter niet de taak om de engine aan het "leren" te krijgen, maar het minimaliseren van fouten in een extreem grote ruimte van evaluatieparameters (de volgorde van 10 ^ 150 discrete parametercombinaties).

Matthew bespreekt zijn proefschrift op het TalkChess-forum. Hij werkt nu voor Google op DeepMind, als ik het me goed herinner.

Bekijk ook de blog van Thomas Petzke. Hij heeft een extreem sterke schaakengine geschreven, iCE, en heeft genetische algoritmen gebruikt om de statische evaluatie van de motor te verbeteren. Bekijk zijn posts uit 2013 en eerder, zoals Population Based Incremental Learning.

Welkom op het forum! Plus een.
Het lijkt erop dat deze discussie is opgelost. [Schaken en Shogi beheersen door zelf te spelen met een algemeen leeralgoritme voor versterking] (https://arxiv.org/pdf/1712.01815.pdf).
#9
+5
David Spencer
2012-07-20 02:53:41 UTC
view on stackexchange narkive permalink

Een Google-zoekopdracht zoals deze kan resultaten opleveren zoals deze.

Ik denk vooral dat je dit document. Ze geven hun engine enkele initiële gegevens, zoals stukwaarden, dus het is niet precies wat je vraagt, maar het presteerde redelijk goed.

+1 omdat ik het interessante IEEE-citaat waardeer. Ik ben toevallig al bekend met de NeuroChess-pagina. Geen van beide lijkt echter te doen wat ik in gedachten had.
#10
+3
ferit
2016-01-11 14:08:22 UTC
view on stackexchange narkive permalink

Het is mogelijk met machine learning.

Het openen van boeken met schaakmachines maakt gebruik van machine learning. De engine test openingsregels in het boek door ze af te spelen, als een regel beter scoort door een andere te vergelijken, promoot het die regel in de openingsboom. Na verloop van tijd leert de betere regels.

Nadat de openingsfase is beëindigd, stopt de engine met het gebruik van het boek en begint de evaluatiefunctie te gebruiken.


Hoe implementeer je een zelflerende engine met behulp van machine learning?

Stel je een engine voor die een boek gebruikt zonder evaluatiefunctie. En het boek is aanvankelijk leeg. Engine heeft dus geen kennis van schaken.

Engine begint te spelen met dit lege boek en sluit het boek pas aan het einde van het spel. We kunnen het zien als een gewone engine die tot het einde van het spel een openingsboek gebruikt.

Na verloop van tijd zou de engine statistisch gezien de beste voortzettingen vinden, aangezien slechte lijnen na verloop van tijd slechter zullen scoren. Maar er moeten natuurlijk veel spellen worden gespeeld om een ​​goed boek te krijgen. Ik weet niet hoeveel, maar zoveel als we kunnen zeggen onpraktisch.

Update december 2017 : Nou, ik denk dat Alpha Zero mij ongelijk heeft bewezen door zichzelf sterk genoeg te trainen om versla een van de sterkste motoren, Stockfish, met een praktisch aantal spellen.

#11
+2
Pep
2015-03-02 05:10:29 UTC
view on stackexchange narkive permalink

Wat je ook probeert op dit gebied, lees eerst het verhaal van Turry hier: http://waitbutwhy.com/2015/01/art Artificial-intelligence-revolution-2.html

TL; DR; spoilerversie per verzoek:

In Turry's verhaal moet Turry's zelf-training AI mooie handgeschreven notities schrijven en uiteindelijk worden mensen weggegooid omdat ze zijn niet nodig om het ogenschijnlijk onschuldige doel van het schrijven van mooie handgeschreven notities te bereiken. De analogie is dat een zelfgetrainde schaakmotor met AI hoogstwaarschijnlijk ook van mensen af ​​zal komen, omdat ze niet nodig zijn om het ogenschijnlijk onschuldige doel van het verbeteren van schaakvaardigheden te verbeteren.

Uw antwoord is interessant, maar misschien niet echt overtuigend. Ik heb het gelinkte artikel (beide delen) op jouw advies gelezen. De schrijver verzwakt zijn zaak een beetje door enkele stromannen aan te vallen, maar hij is een bedachtzame kerel. Ik * denk * niet dat ik zoiets als de Turry van het artikel in gedachten had. Een 8-bij-8-schaakbord waarop twee spelers ongeveer 40 discrete beurten nemen, is gewoon zo fundamenteel eenvoudiger. Ik vind het opmerkelijk dat AI niet eens in het algemeen over schaken kan denken. Voor een tegengestelde mening, toegewezen lezing: Feser, Edward. * The Last Superstition. * Toch +1 voor rente.
#12
+1
prusswan
2017-12-23 00:51:54 UTC
view on stackexchange narkive permalink

En er is AlphaZero. Vier een hele nieuwe generatie schaakmachines

#13
  0
Brian Towers
2015-12-31 21:00:58 UTC
view on stackexchange narkive permalink

Het gebruik van antropomorfe terminologie bij het omgaan met computersystemen is een symptoom van professionele onvolwassenheid

Van Hoe vertellen we waarheden die pijn kunnen doen? door Edsger W. Dijkstra vat vrijwel de verkeerde veronderstelling samen die aan uw vraag ten grondslag ligt. Kunstmatige intelligentie is misschien kunstmatig, maar het is geen intelligentie in de menselijke zin.

In de Reith Lectures uit 1984 voor de BBC legt de Amerikaanse filosoof John Searle precies uit wat er mis is met harde AI. . De "te lang, niet geluisterd" samenvatting van zijn betoog is "Syntaxis is geen semantiek", maar ik zou je niettemin willen aanmoedigen om in ieder geval te luisteren naar lezing 2 "Beer Cans & Meat Machines".

Als je eenmaal begrijpt wat Dijkstra en Searle meer dan 30 jaar geleden zeiden, zul je herkennen wat er mis is met je vragen:

Heeft iemand ooit een schaakprogramma geschreven? die wel eigen inzichten heeft? Dat leert het spel vanzelf?

Mensen hebben "inzichten" en kunnen leren. Computers kunnen dat niet. Uw dorp van primitieve mensen heeft door de eeuwen heen de theorie van het openen van schaken kunnen reproduceren, maar computers niet.

Beweert u dat computers geen intelligentie op menselijk niveau zullen bereiken, of dat zelfs dan "denken" en "begrijpen" voorbehouden is aan mensen?
@BlindKungFuMaster Als je de moeite neemt om naar "Beer Cans and Meat Machines" te luisteren in de link hierboven, zal het je duidelijk zijn wat John Searle denkt. Hij overtuigde me en ik deel zijn mening.
Searle's simplistische begrip van AI-computerprogramma's is te verontschuldigen, het is tenslotte pas 1984. Maar moderne AI-architecturen bootsen alleen de architectuur van de menselijke geest na, dus alleen de architectuur wordt syntactisch beschreven, niet wat uiteindelijk het 'denken' doet. "Kracht (nog niet helemaal) gelijk aan de kracht van het menselijk brein" komt voort uit het opnemen van grote hoeveelheden gegevens, door te "leren". Pas bij deze stap wordt semantische inhoud vastgelegd.
Het argument van de Chinese kamer is dus onjuist door aan te nemen dat je begrip zou kunnen simuleren met alleen een groot rulebook, wat in feite relatief absurd is, en door af te zien van de mogelijkheid dat in plaats daarvan semantische inhoud kan worden vastgelegd door de juiste architectuur uit grote hoeveelheden gegevens. Dit is in feite waar Natural Language Processing tegenwoordig om draait: http://cs224d.stanford.edu/syllabus.html
@BlindKungFuMaster Er is één sleutelwoord in wat u zegt, waarvan het lijkt dat u het niet begrijpt. Het is het woord "simuleren". Ik ben al 35 jaar een computer software engineer en in die tijd heb ik veel simulatoren gehad en heb ik er ook een paar geschreven. Simulatoren zijn vaak vitale componenten van een project, maar in een realtime project vervangen ze nooit de beoogde apparatuur volledig. Computers zijn ongetwijfeld uitstekend in het simuleren van intelligentie en semantisch begrip, maar ze kunnen nooit bewustzijn, wilsbegrip en begrip bereiken.
Ik denk dat je Searle moet begrijpen in de context van de technologie uit 1984. Wat hij zegt is dat je een programma niet kunt schrijven, uitvoeren, en het zal bewust begrip hebben. Wat hij niet voorziet, is de mogelijkheid om de architectuur gewoon te coderen en het vervolgens te laten leren totdat het semantisch begrip en mentale toestanden ontwikkelt, net zoals een menselijke baby dat doet.
Aan het einde van zijn lezing zegt hij dat als je een menselijk hersenatoom voor atoom bouwt, je het echte werk, het begrip, de wil en al het goede spul krijgt. Hieruit volgt dat als je het menselijk brein simuleert, atoom voor atoom, je ook het echte brein krijgt. En het is niet echt mogelijk om dit te ontkennen, want we zouden tenslotte allemaal gesimuleerde hersenen kunnen zijn in een gigantische computer, er is gewoon geen manier om het verschil te zien. Het alternatief is een Schrödinger-katachtig bewustzijnslimiet: we zijn bewust… behalve als we worden gesimuleerd, maar we kunnen het niet vertellen.
Ik ben blij dat mijn vraag van vier jaar geleden nog steeds zoveel belangstelling wekt! @BrianTowers, bedankt voor het antwoorden. Mede door de uitstekende antwoorden die anderen hebben gegeven, heb ik behoorlijk wat buiten gelezen sinds ik de vraag voor het eerst stelde. De vraag is niet gemakkelijk. Ik kan zien waarom u antwoordt zoals u doet, ook al heeft uw antwoord mij niet overtuigd.
#14
  0
thb
2016-01-10 23:10:00 UTC
view on stackexchange narkive permalink

Dit antwoord wordt vier jaar na de vraag gegeven door de vragensteller van de oorspronkelijke vraag. Het vervangt of vervangt de eerder gegeven antwoorden niet, want de meeste eerdere antwoorden zijn interessanter dan deze. Dit antwoord zou echter wat extra context kunnen toevoegen.

Voor zover ik kan nagaan, lijkt het meeste AI-onderzoek impliciet de premisse te aanvaarden dat gedachte en rede uitsluitend materiële verschijnselen waren, of in ieder geval dat de resultaten niet te onderscheiden zijn van gedachten en rede moet noodzakelijkerwijs haalbaar zijn door uitsluitend materiële processen. Ik betwist het uitgangspunt niet (en promoot het hier trouwens ook niet). Ik merk alleen op dat het als een premisse lijkt te zijn.

En tenslotte, hoe zou dit bij AI-onderzoek geen premisse moeten zijn? AI-onderzoekers moeten materiële processen doorlopen, of ze dat nu willen of niet.

De scholieren van de realistische filosofie, terug via Duns Scotus, St. Thomas, Aristoteles en Plato, hebben veel te zeggen over de theory of mind. Representationalisten zoals Kant hadden nogal verschillende dingen te zeggen. AI-onderzoek staat waarschijnlijk dichter bij Kant, maar dit maakt de scholieren niet verkeerd.

Toegegeven, er is een God-van-de-hiaten bezwaar dat op dit punt naar voren komt in gesprekken van de huidige soort, maar een professionele filosoof zou je vertellen dat de God van -the-gaps-bezwaar valt een stroman aan, dat dit bezwaar alleen nuttig is tegen personen die geen filosofie hebben gestudeerd en dus niet weten waar ze het over hebben. Volgens Aristoteles is het een formeel en definitief oorzakelijk verband dat betrokken zou kunnen zijn bij de kwestie van de zelfgetrainde schaak-AI. Maar in Aristotelische termen werkt de AI-onderzoeker puur met materiaal en vooral met efficiënte causaliteit (behalve misschien schuin, voor zover menselijke trainers persoonlijk formele en laatste elementen in het systeem brengen ). Als de reden formeel is, als de gedachte definitief is, als Searle's Chinese kamer een ontologische onmogelijkheid blijkt te zijn (wat het ook zou kunnen), dan kan het zijn dat een puur zelfgetrainde schaak-AI dat zelfs in theorie niet kan zijn. bereikt.

Ik vermoed dat een puur zelfgetrainde schaak-AI inderdaad kan worden bereikt, en zal zijn - dat, in Aristotleïsche termen, deze vraag adequaat zal blijken te zijn met het oog op louter efficiënte causaliteit. Ik sta in het algemeen sceptischer tegenover sterke AI, maar dit moet in de ervaring worden bewezen, nietwaar? Niemand weet het echt.

De filosofie van causaliteit en geest is subtiel en wordt door weinigen begrepen (en waarschijnlijk door weinigen, zelfs onder AI-onderzoekers, die meer praktische mannen zijn). Als je zo'n filosofie wilt leren, is het de moeite waard om te leren; maar houd er rekening mee dat het op internet en zelfs vaak in gedrukte vorm buitengewoon gemakkelijk is om misleidende verklaringen te vinden die gebaseerd zijn op onontgonnen misverstanden. Voor mijn geld is Edward Feser de beste inleidende leraar die vandaag over dit onderwerp schrijft, wiens boeken tegen redelijke prijzen in druk blijven. Je kunt veel meer van hem leren.

Men betwijfelt echter of zelfs Dr. Feser een gezaghebbend antwoord op de huidige vraag zou wagen! Het antwoord moet nog worden bewezen in de laboratoria van AI.

#15
-3
Lyudmil Tsvetkov
2017-12-10 19:53:04 UTC
view on stackexchange narkive permalink

Ik wil dat ze de code vrijgeven, dan kunnen we praten. Het is niet zo eenvoudig om schaken op te lossen, Alpha zal het zelfs niet binnen een halve eeuw oplossen. Grappig genoeg speelt het nog steeds 1.d4. Waarom? Omdat het is getraind in menselijke spellen en de menselijke theorie de hoogste prestaties levert voor 1.d4. Het arme ding weet niet 1 ... c5 krijgt remise in precies 8 zetten. Nu willen ze dat ik geloof dat Alpha geen gesimuleerd openingsboek heeft gebruikt ... Ze zeggen dat Alpha de openingen geweldig speelde. Ja, op enkele uitzonderingen na. 1.d4 spreekt zeker niet goed over het niveau van intelligentie dat het programma heeft bereikt. Gelukkig is SF nog zwakker in de openingsfase. :)

U maakt gewaagde beweringen door te zeggen dat 1. ... c5 remise behaalt in 8 zetten en dat Stockfish zwak is in de openingsfase. Kunt u alstublieft verwijzingen naar deze claims geven?
* 1.d4 spreekt zeker niet goed over het niveau van intelligentie dat het programma heeft bereikt. * Als 1.d4-speler vraag ik me af of ik moet bedenken dat mijn intelligentie hier wordt beledigd.
Hoewel ze de code niet hebben vrijgegeven of zelfs de paper hebben gepubliceerd, is er een project gelanceerd om hun resultaat te reproduceren: http://lczero.org/ Je kunt zelfs spelen met de evoluerende "AlphaZero" op http: //play.lczero. org /


Deze Q&A is automatisch vertaald vanuit de Engelse taal.De originele inhoud is beschikbaar op stackexchange, waarvoor we bedanken voor de cc by-sa 3.0-licentie waaronder het wordt gedistribueerd.
Loading...