Domanda:
Perché lo Stoccafisso sottovaluta i pedoni rispetto al classico approccio "un pezzo vale tre pedoni"?
emdio
2020-05-09 16:13:10 UTC
view on stackexchange narkive permalink

Stavo dando un'occhiata ai valori che i motori danno a pedoni e pezzi e sono rimasto piuttosto scioccato dai valori di Stockfish per il mediogioco (Mg):

  • PawnValueMg = 128

  • KnightValueMg = 721 ~ 5.6 pedoni

  • BishopValueMg = 825 ~ 6,4 pedoni

  • RookValueMg = 1276 ~ 9,9 pedoni

  • QueenValueMg = 2538 ~ 19,8 pedoni

Quindi questo è molto lontano dallo standard "1 pezzo equivale a 3 pedoni approccio", e Ero curioso del motivo.

Inoltre, il fatto che gli alfieri siano 0,8 pedoni più preziosi dei cavalieri ha attirato la mia attenzione.

Sono consapevole che questa è una piccola parte della funzione di valutazione di Stockfish (o per quel caso, qualsiasi motore serio), ma anche così sembra davvero molto diverso dall'approccio classico.

Sono abbastanza sicuro che i valori siano sintonizzati empiricamente. Spiegare perché - come in 'perché un Alfiere vale 0,8 pedoni in più dei cavalieri nella generica posizione di medio gioco - sebbene sia probabilmente al di là delle capacità di chiunque sul pianeta. Funziona, è tutto quello che tutti sanno.
"Funziona" significa "funziona nel contesto dell'algoritmo di valutazione dello Stockfish". Ciò non significa che funzionerebbe per gli esseri umani!
La regola pratica è 3 pedoni in un cavaliere / alfiere. Ma questa è una semplificazione. Un alfiere vale quasi sempre più di un cavaliere ed entrambi i pezzi valgono quasi sempre più di 3 pedoni. Questa regola funziona per una semplificazione, ma Stockfish non si preoccupa delle semplificazioni.
Quattro risposte:
#1
+48
user1583209
2020-05-10 00:46:30 UTC
view on stackexchange narkive permalink

Non sono un esperto del codice sorgente dello stoccafisso, ma la mia comprensione è la seguente.

Umani:

È vero che 1 pezzo equivale a 3 pedoni approccio è abbastanza accurato, sorprendentemente così. Tuttavia, come probabilmente saprai, nel valutare una posizione, consideriamo anche molti altri aspetti, come l'attività del pezzo, lo spazio, la sicurezza del re, ecc. La differenza tuttavia è che non assegniamo valori numerici effettivi a questi altri fattori.

Stoccafisso (o motori simili):

A differenza degli esseri umani, i motori assegnano valori numerici a tutti i fattori. I numeri che citi sono solo una piccola parte della funzione di valutazione.

Dai un'occhiata alla funzione di valutazione del gioco medio per lo stockfish. In quella pagina puoi anche modificare la scheda per vedere la valutazione e puoi visitare le funzioni specifiche come `piece_value_mg 'che si occupa di questi numeri.

Come puoi vedere, solo i valori dei pezzi di tutti i pezzi ammontano a 9326. Tuttavia ci sono molte altre funzioni che si aggiungono alla valutazione. Ancora più importante, non tutte queste funzioni extra trattano le pedine e i pezzi allo stesso modo.

Ad esempio:

  • `Psqt mg ', fornisce valori a solo pedine, a seconda della loro posizione sul tabellone. Come ci si aspetterebbe, i pedoni al centro hanno più valore (il pedone su e4 invece di e2 è +24 punti)
  • un'altra funzione solo pedoni: `Pawns mg 'dà punti a seconda della struttura del pedone (isolato, pedoni raddoppiati, collegati, ecc.) anche qui puoi guadagnare diversi decimi di punti per i pedoni (ma non per i pezzi).

Per essere onesti, ci sono anche funzioni che si occupano solo di pezzi come "Pieces mg". Tuttavia si noti che possono anche dare una penalità (valore negativo) alla valutazione totale. Infatti per la posizione di partenza hai -63 da quella funzione.


In sintesi ...

Lo stoccafisso ha una funzione di valutazione a grana molto più fine rispetto a noi umani. Il valore del pezzo puro dello stoccafisso non può essere paragonato al valore del pezzo umano.

Nello stoccafisso i pezzi e le pedine possono guadagnare punti in altri modi oltre ai valori menzionati. Inoltre, lo stoccafisso non considera il pezzo da solo, ma anche come si rapporta ad altri pezzi, ad es. se ci sono pedoni raddoppiati, un avamposto, ecc.

Se controlli il codice, questi altri fattori sono ciascuno nella gamma di diversi dieci punti, quindi se li prendi tutti insieme potresti benissimo guadagnare i 100 punti necessari affinché il pedone sia 1/3 di un pezzo.

Matematicamente potresti anche considerarlo come una sorta di approssimazione o media in cui assegni un singolo numero (valore del pezzo umano) per il sistema molto complesso utilizzato dallo stoccafisso. Non c'è motivo per cui il valore medio (valore del pezzo umano) abbia qualche relazione con uno dei parametri (ValueMG) nell'universo dello stoccafisso.

Consiglio vivamente di vedere di persona al link quanto sia più completo la valutazione dello stoccafisso è.

+1 Ottima risposta.
#2
+10
David
2020-05-10 04:24:14 UTC
view on stackexchange narkive permalink

Si noti che questi valori sono "astratti", per essere successivamente modificati dalle specifiche della posizione. Ad esempio, anche se un cavaliere sembra 0.8 pedine meno preziose di un alfiere, potrebbe essere che vengano assegnati bonus maggiori ai cavalieri ben piazzati rispetto agli alfieri ben piazzati, ribaltando l'equilibrio.

Vale la pena notare che "3 pedine equivalgono a un pezzo" è, a tutti gli effetti pratici, privo di significato. In alcuni tipi di posizioni (quelle con potenti attacchi contro il re, per esempio), le pedine extra possono essere inutili contro un pezzo. Nelle partite finali, tre pedoni spesso sconfiggono il pezzo, specialmente se non rimangono molti pedoni extra

Penso che questo sia il più grande: i modificatori di quei numeri possono essere così significativi da rendere i numeri di base privi di significato.
#3
+6
supercat
2020-05-10 02:14:05 UTC
view on stackexchange narkive permalink

Il valore di un pezzo o di un pedone dipenderà molto da quanto bene è posizionato. I valori comuni 1/3 / 3,5 / 5/9 sono stime ragionevoli per pezzi che sono posizionati in modo decente ma non sorprendentemente bene. Per vari motivi, potrebbe essere più facile fare in modo che il punteggio di base di un pezzo rappresenti un brano che è molto peggiore del tipico (in modo che la maggior parte dei pezzi abbia un punteggio aggiustato più alto), o forse rappresenti molto meglio del normale (in modo che la maggior parte dei pezzi ottenga un punteggio inferiore). Come esempio artificioso esagerato, considera qualcosa del tipo:

  8 / p / Pp / RP / 1P2nn / RP / P / 5K1k w - - 0 1  

Anche se il Bianco ha nominalmente un vantaggio materiale sostanziale (su due volte lo Scambio, più tre pedoni), il Nero non può perdere senza catturare nessuna delle pedine o dei pezzi Bianchi. Sebbene scambiare un pedone per una torre sarebbe normalmente un buon scambio, in questo caso è molto pessimo poiché i pezzi del Bianco sono completamente inutili. Il nero sarà nominalmente in grado di scambiare un pedone con una torre, il che sembrerebbe un vantaggio, ma così facendo aumenterebbe enormemente il valore dei pezzi del bianco.

Se è il bianco a muoversi con questo esempio, io penso che il bianco dovrebbe essere in grado di vincere un pareggio, e il nero certamente dovrebbe essere in grado di farlo almeno. Giocando contro il livello 3 di Stockfish su lichess.org, tuttavia, sono stato in grado di vincere come entrambe le parti perché Stockfish ha sopravvalutato il materiale a sinistra e pensa che valga la pena scambiarlo (penso che il Bianco dovrebbe essere in grado di vincere un pareggio spostando R3- a4, e poi a3, ma Stockfish non l'ha trovato giocando come Bianco, e potrebbe esserci un modo per il Nero di catturare la torre in una situazione in cui il Nero potrebbe quindi forzare il pareggio con check / ripetizione perpetua, ma il Nero non dovrebbe avere scuse per aver perso qui.

Anche in situazioni meno artificiose, lo Stockfish a volte non riesce a distinguere adeguatamente tra i pezzi che non sono attualmente nella mischia, ma ci arriveranno, contro i pezzi che possono essere tenuti fuori dall'azione molto a buon mercato mentre l'avversario ha un sostanziale maggioranza del materiale ad efficacia immediata. Una caratteristica comune dei giochi tra reti neurali e Stockfish è che Stockfish finisce per lasciare che alcuni dei suoi pezzi restino fuori dall'azione mentre l'avversario usa la sua maggioranza di potere per sfruttare ulteriori vantaggi, finché nel momento in cui i pezzi bloccati non si muovono , il gioco è già perso.

Per inciso, stavo solo giocando con un'altra variazione su quell'esempio (nero per giocare)

  7K / p7 / Pp6 / RP6 / QP4q1 / RP3k2 / P7 / 8 b - - 0 1  

Il Nero ha un compagno su quattro, ma Stockfish, anche se impostato al livello più alto su lichess.org, bloccherà il Bianco tramite Qg6 piuttosto piuttosto che ottenere la vittoria, probabilmente perché qualsiasi mossa che continui a giocare con uno squilibrio materiale così grande è vista come così massicciamente inferiore allo stallo che non vale la pena indagare ulteriormente.

In quell'ultimo esempio, in che modo il nero forza una vittoria? "sposta il re in g4", poi il bianco risponde con Kg1 ed è comunque un pareggio (es. Kg4, Kg1 Kh3, Kh1 g2, Kg1 Kg3)? Lo stoccafisso probabilmente va per il pareggio perché è un pareggio, a meno che non mi manchi qualcosa?
@ZLK: Qualche idea del perché il livello 8 di stoccafisso su lichess dovrebbe fare Kf1 anziché Kh1 in quella linea?
@ZLK: Penso di aver capito perché Stockfish non è mai stato così impertinente da giocare Kh1. Anche se il Nero riuscisse a promuovere il pedone, il Bianco sarebbe comunque avanti di due torri e tre pedoni, quindi uno stallo sarebbe visto come un brutto risultato per il Bianco.
@ZLK: Ho rielaborato l'esempio per mostrare ancora più chiaramente che Stockfish sta sopravvalutando i pezzi che non possono muoversi. Il nero può ottenere immediatamente un pareggio e nessuna posizione che può essere raggiunta entro tre mosse offrirebbe prospettive che non siano molto peggiori. Non credo che il comportamento di Stockfish rappresenti necessariamente un "difetto", in quanto migliorare il gioco in questo tipo di situazione artificiosa richiederebbe di spendere più tempo a perseguire linee che difficilmente sarebbero utili al di fuori di tali situazioni artificiose. Ancora interessante, però, che SF sarebbe cieco per un compagno in quattro dove tutte le mosse di White ...
... sono forzati o, nel caso in cui il Bianco avrebbe una scelta, l'unica mossa alternativa consentirebbe il compagno immediato.
In quell'ultimo esempio, il mio Stockfish trova il mate in meno di un secondo (?)
@Allure: Lo Stockfish su LiChess ha opzioni di configurazione limitate e la sua configurazione è probabilmente impostata per eliminare appena la mossa chiave anche sulla sua impostazione più alta. Volevo modificare l'esempio per mostrare fino a che punto si poteva spingere la valutazione, ma per farlo funzionare con altre configurazioni potrebbe essere necessario spingere il compagno più lontano (ad esempio, forse spostando il re del nero in c8 invece che in c6).
#4
+3
SmallChess
2020-05-09 20:10:21 UTC
view on stackexchange narkive permalink

Temo che sia stato messo a punto dalla macchina. Nessuno sa esattamente perché. È come se nessuno capisse veramente i pesi della rete in LC0. In ogni caso, 3 pedine = un pezzo non è altro che una guida generale per i principianti di scacchi.

Penso che ci sia di più (vedi la mia risposta troppo lunga). Se un pezzo valesse davvero 6 pedoni, dubito che lo stoccafisso giocherebbe altrettanto bene.


Questa domanda e risposta è stata tradotta automaticamente dalla lingua inglese. Il contenuto originale è disponibile su stackexchange, che ringraziamo per la licenza cc by-sa 4.0 con cui è distribuito.
Loading...