Domanda:
Stoccafisso ELO vs profondità di ricerca
tba
2014-12-17 07:55:44 UTC
view on stackexchange narkive permalink

Potrebbe Stockfish battere Magnus Carlsen se le sue mosse fossero calcolate con il comando UCI "go depth 16"? In caso contrario, come posso trovare la profondità "d" alla quale la forza di Stockfish supera i migliori GM?

Presumiamo che Magnus abbia i controlli temporali standard e che Stockfish sia limitato solo dalla profondità di ricerca.

Mi piacerebbe vedere un grafico di Stockfish ELO (contro un avversario con controlli temporali standard) vs profondità di ricerca. Esiste qualcosa di simile?

Contesto: sto analizzando i giochi GM per vedere quando gli esseri umani commettono errori, come questo. Voglio impostare la mia profondità di ricerca "d" in modo che quando il motore e le mosse umane non sono d'accordo, posso essere certo che l'umano ha commesso un errore.

Domanda difficile. Se stai usando Stockfish (o programmi migliori) con l'apertura di libri e tavoli di fine partita, è giusto scommettere che se l'umano e il giocatore non sono d'accordo, l'umano ha quasi certamente sbagliato. Non saprei come limitare in modo significativo il motore a una certa profondità. Non credo sia una cosa fissa: suoneranno più in profondità se non sono in una posizione di quiescenza.
Questa è una domanda molto difficile perché nessuno lo sa a meno che lo stesso Carlsen non si sieda e suoni lo Stoccafisso per ogni profondità.
Nota che ci sono una manciata di grafici riprodotti tra computer per varie profondità. È facile da generare. Ma è impossibile generarne uno per GM umani perché non ci sono dati.
La profondità di ricerca è un concetto sfocato per i motori moderni. Di solito vanno selettivamente molto più in profondità. Se interrompi tutti i calcoli dopo x strati, non sono sicuro che raggiungerai la forza GM prima della profondità 25+.
Nel caso in cui partecipi alla competizione Kaggle: se vuoi analizzare 50000 giochi a una profondità che equivale a qualcosa come 2900 Elo ... avrai bisogno di molte ore di CPU.
@Seth Projnabrata Nella sua conversazione con Damis Habies Kasparov ha detto che "nella sua buona giornata, Magnus aveva la possibilità di pareggiare, ma per vincere era impossibile". Guarda questo gioco (https://www.chessgames.com/perl/chessgame?gid=1790342), uno dei migliori giochi di Magnus, alla mossa 15. Bh6, magnus ha bisogno di qualche minuto per trovare quella mossa, ma Stockfish bastano 2-4 secondi (nota che Stockfish gira solo su un singolo core con 2000 kN / s di velocità CPU). Se vedi le mosse magiche di Tal, Fischer, Kasparov, Anand, Magnus e altri Super Grandmasters, impiegano pochi minuti per trovare tali mosse magiche, ma Stockfish
Tre risposte:
BlindKungFuMaster
2014-12-17 14:16:14 UTC
view on stackexchange narkive permalink

In realtà esiste una risposta elaborata in modo ambizioso:

http://web.ist.utl.pt/diogo.ferreira/papers/ferreira13impact.pdf

A pagina 77 trovi la tabella pertinente:

  depth: elo: 20 289419 282818 276117 269516 262915 2563…  

Quindi il mio il commento era leggermente sfasato, la profondità 20 è già molto forte. Resta comunque il punto, che è difficile confrontare la profondità di ricerca tra motori diversi, perché non è mai forza bruta e selettivamente vanno molto più in profondità della profondità data. (Nel documento hanno usato Houdini 1.5, forse qualche esperto di motori può mettere in relazione la profondità di ricerca di Houdini con la profondità di ricerca di Stockfish.)

Si noti che la carta ottiene i dati tramite riproduzione automatica. Ciò implica che l'Elo risultante potrebbe non essere molto rappresentativo.
Ho solo sfogliato il foglio, ma penso che ancorano l'Elo a profondità 20 con qualche confronto con i giochi di alto livello e ottengono solo la differenza di profondità = percentuale di vincita = differenza di elo giocando da soli. Quindi almeno la profondità 20 = 2894 Elo dovrebbe essere la coppia più precisa.
Ferreira ha cercato di stimare la forza di Houdini in base al grado in cui i suoi suggerimenti di mosse si allineavano con Kramnik e altri che giocavano nel London Chess Classic 2011. Il margine di errore per una tale stima deve essere enorme.
Lo stoccafisso tende a segnalare profondità maggiori rispetto a Houdini o Komodo per lo stesso periodo di tempo. Il rapporto sulla profondità non è affatto standardizzato e può significare cose molto diverse a seconda del motore.
@BlindKungFuMaster Buon punto. Sembra che poiché è ancorato a profondità 20, più bassa è la profondità, meno precisa. Ad esempio, profondità 8 = 2099 Elo, profondità 7 = 2033 Elo, profondità 6 = 1966 Elo, e il delta Elo tra i livelli è abbastanza consistentemente 66 Elo. Quindi estrapolando, profondità 5 = 1900, profondità 4 = 1834, profondità 3 = 1768, profondità 2 = 1702 e profondità 1 = 1636. Che sembrano tutte piuttosto alte. [Altri utenti hanno eseguito dei test] (http://rybkaforum.net/cgi-bin/rybkaforum/topic_show.pl?tid=18656) e il delta Elo aumenta al diminuire della profondità di ricerca, il che ha un senso intuitivo.
questa è una carta fantastica!
Seth Projnabrata
2017-02-14 19:37:45 UTC
view on stackexchange narkive permalink

Deep Blue avrà una valutazione più alta dato che era un supercomputer. Tieni presente che tutti i motori scacchistici hanno una valutazione superiore a 3000+, che nessun essere umano è stato in grado di raggiungere finora.

Faccio Deep Blue come esempio perché c'è qualcosa chiamato adattabilità. L'adattabilità è ciò che i programmatori di scacchi usano per migliorare la preforma di un motore di scacchi. Nel 1996, quando Garry Kasparov ha battuto Deep Blue, IBM ha migliorato Deep Blue per nascondere le debolezze del computer che Kasparov ha rivelato durante il suo gioco. Hanno coperto le loro azioni, rafforzato Deep Blue, e poi ha sconfitto Kasparov nella rivincita del 1997.

I motori di scacchi traggono la loro forza in base al gioco / ELo dei migliori giocatori. Se stai solo vedendo un numero più alto e prendi la tua decisione, allora non sarebbe il modo migliore per giudicare. Direi che la miglior giocata di Magnus Carlsen sconfiggerà la migliore giocata di Stockfish in qualsiasi giorno.

Adam
2019-12-25 16:07:46 UTC
view on stackexchange narkive permalink

Sì, Brainfish 221119 Depth 16 può battere Carlsen anche se corre solo a 2000 Kn / s nella posizione di partenza. Brainfish 221119 profondità 16 ha una valutazione ELO 2820.

Questa valutazione ELO 2820 è una valutazione standard, non una valutazione rapida o blitz.



Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 3.0 con cui è distribuito.
Loading...