lunedì 30 aprile 2007

On Distinguishing Epistemic from Pragmatic Action

On Distinguishing Epistemic from Pragmatic Action
David Kirsh e Paul Maglio
Cognitive Science 18, 513-549 (1994)


Il testo completo può essere trovato qui.
Articolo originalmente citato da Clark & Chalmers nel loro saggio (mia sheda) su Analisys che dà l’avvio alla discussione sulla Mente Estesa. Mi sembra che abbia un grande interesse sia all’interno di tale discussione sia in una prospettiva un po’ meno angusta.
Ha un’importanza enorme per la mia ricerca.

K&M propongono di fare una distinzione tra due categorie di azioni che un agente può intraprendere:
  • Azioni pragmatiche
  • Intraprese per modificare il mondo per raggiungere un obiettivo pratico desiderato.

  • Azioni epistemiche
  • Intraprese per modificare il mondo per ricavare informazioni su di esso e migliorare lo stato computazionale-informativo del soggetto

Molte azioni che possono viste come irrazionali, casuali o dispendiose se considerate solo dal punto di vista dell’effetto che producono sul mondo fisico, acquistano un tutto altro significato quando vengono considerate alterazioni dell’ambiente per estrarne informazioni e modificare lo stato informativo del soggetto.

Un’azione può essere considerata epistemica quando
  1. riduce la memoria necessaria alla computazione mentale
  2. riduce il numero di passi necessari alla computazione mentale
  3. riduce la probabilità di errore della computazione mentale.

Il concetto di azione epistemica, di azione intrapresa nel mondo esterno per risparmiare risorse o rendere più efficace una computazione esterna non è poi così inusuale. Basta pensare alla manipolazione di simboli esterni nella computazioni matematiche, alla movimento effettivo del pezzo che un giocatore inesperto di scacchi preferisce fare per prevederne gli effetti, il nastro che ci leghiamo al dito per ricordarci di qualcosa, la prima cernita dei pezzi di un puzzle per favorirne l’identificazione, ecc. Ma non sempre è stata data sufficiente attenzione alla interazione tra momento cognitivo momento motorio nella costruzione dei modelli.
Ci sono tre principali ragioni per aver scelto il gioco del Tetris per questo studio: è un gioco veloce che richiede rapide decisioni percettive e cognitive; è facile distinguere le azioni pragmatiche da quelle epistemiche; è divertente e ci sono molti soggetti che si prestano.


Un modello classico dell’elaborazione informativa

Quattro fasi fondamentali:
  1. creazione di una rappresentazione iniziale (bitmap) delle caratteristiche della situazione attuale
  2. codificazione della rappresentazione bitmap in una rappresentazione simbolica più compatta
  3. calcolare del luogo migliore dove piazzare il pezzo (zoide)
  4. calcolare la sequenza di mosse per piazzare il pezzo.
Tale modello è completamente sequenziale, il sistema di controllo dei muscoli non può ricevere segnali prima che la formulazione del piano sia completato.

Questo modello non è realistico e i dati raccolti lo contraddicono apertamente.
Sono state registrate moltissime rotazioni e traslazioni, spesso fin dal primo momento in cui uno zoide compare sullo schermo. E’ chiaro che i giocatori, spesso i più esperti, iniziano a ruotare i pezzi prima di potuto formulare un piano o anche prima di averli potuti identificare.
Si potrebbe salvare questo modello dicendo che le azioni pragmatiche iniziano prima che si abbia un piano completo per risparmiare tempo (interleaving). Ma l’interleaving ha senso solo in un contesto altamente imprevedibile e dinamico (il Tetris non lo è) e i costi di una falsa partenza nel Tetris sono più alti di quelli di una attesa.

Secondo K&M il fallimento di modello di pianificazione classico o con interleaving nello spiegare il dato delle extra rotazioni è una diretta conseguenza dell’assunzione che le azioni siano sempre pragmatiche; credere che l’unica ragione per cui si agisce e di modificare lo stato di cose in vista dell’obiettivo finale. Secondo questa posizione tradizionale le azioni controllate dalla fase 4 non possono mai iniziare prima che la fase 3 sia conclusa o per aiutare il riconoscimento della fase 2. In questa posizione la cognizione è necessaria per l’azione intelligente, ma l’azione non è mai necessaria per la cognizione intelligente.

Ma secondo K&M è necessario riconoscere che spesso un’azione viene compiuta con lo scopo di metterci nella posizione di riconoscere, calcolare, meglio; il tempo che ci serve a compiere una o due rotazioni può essere risparmiato nel momento della decisione.

L’uso epistemico delle rotazioni e delle traslazioni

Le rotazioni servono principalmente per:
  1. ricavare immediate informazioni sul pezzo
    Zoidi entrano una cella alla volta, ambigui. Rotazione aiuta ad identificarli prima che siano emersi completamente. I dati mostrano che zoidi ambigui per forma e posizione vengono ruotati più spesso.
  2. Risparmiare “energie” nella rotazione di immagini mentali.
    La rotazione fisica di 90° di uno zoide richiede circa 100ms; la stessa rotazione mentale circa 800-1200ms.
    Ma oltre al tempo è necessario prendere in considerazione il carico computazionale e la affidabilità della rotazione mentale.
  3. semplificare il processo di accoppiamento tra contorno e pezzo
    E’ giustifica presupporre che l’accoppiamento avvenga nella memoria di lavoro? Potrebbe avvenire a seguito di un processo percettivo; nella fase 2 e non nella 3. E la rotazione potrebbe fornire il giusto input per il riconoscimento percettivo.

Le traslazioni servono principalmente per:
  1. rendere sicuro il dropping
    I dati mostrano che più i pezzi vengono fatti cadere dall’alto (più possibilità d’errore) più il dropping viene fatto precedere da un rapido spostamento del pezzo sul bordo e un successivo riposizionamento. Questo ovviamente è un costo in termini di movimento effettivo, ma una maggiore sicurezza nel computo della colonna esatta.


Conclusioni

Spesso un giocatore non intraprende un’azione per migliorare il compito nell’ambiente esterno, ma per mettersi in una posizione cognitiva migliore. Le azioni epistemiche hanno lo scopo di modificare il sistema d’elaborazione dell’informazione del soggetto; rappresentano “trucchi” con cui ottenere pezzi d’informazione a basso costo.
Sarebbe quindi bene pensare a modelli d’elaborazione dell’informazioni che mettano le varie unità funzionale nel soggetto in un più stretto rapporto con il mondo esterno.
Per esempio l’unità che presiede all’attenzione e al riconoscimento dovrebbe essere in grado di attivare direttamente il sistema motorio senza passare per la fase 3 o 4.
Nella modellizzazione ci dovremmo sempre chiedere “quali azioni un agente potrebbe compiere per rendere il suo compito più fattibile, più facilmente computabile?”. Pensare che spesso il soggetto può servirsi direttamente del mondo per i suoi compiti cognitivi che non debbono avvenire sempre in un mondo rappresentato all’interno del soggetto. Pensiamo per esempio alla semplificazione dei propri calcoli che il giocatore inesperto di scacchi ottiene modificando effettivamente la scacchiera (spostando il pezzo che intende muovere), invece di calcolare utto nelal propria testa. Ma modelli del genere rappresentano un allontanamento da quelli ortodossi in scienza cognitiva.
Molte azioni vengono intraprese non per l’effetto che hanno sul mondo ma per l’effetto che hanno su di noi.


2 commenti:

Anonimo ha detto...

imparato molto

Anonimo ha detto...

Si, probabilmente lo e