Teoría da decisión racional

Na Galipedia, a Wikipedia en galego.
Saltar ata a navegación Saltar á procura

A teoría da decisión versa sobre o conxunto de decisións que unha persoa pode tomar dentro dunha serie de accións posíbeis e ao razoamento que subxace a ditas eleccións, independentemente da natureza das preferencias. Segundo a teoría formal, hai unha serie de criterios básicos ou lóxicos que hai que cumprir. En primeiro lugar a transitividade, a completude e asimetría e a simetría da indiferenza. Se estes criterios son violados é imposíbel saber cales son as preferencias do individuo e consideraremos que non actúa de forma loxicamente consistente. Se, pola contra se cumpren, pódese establecer unha orde de preferencias de menor a maior, do menos preferido ao máis preferido como función de utilidade. O paradigma canónico desta teoría inclúe a un individuo que toma decisións as cales se dan por supostas segundo unha orde de preferencias. Con todo, podemos falar da teoría da decisión tanto coma unha teoría de crenzas, desexos e outras actitudes relevantes como unha teoría de elección en si mesma.

Tomamos malas decisións en base a uns nesgos cognitivos. Deste xeito, a teoría da decisión ensínanos a realizar os cálculos necesarios para tomar boas decisións. Unha cuestión importante abordada dende esta teoría é a referida aos criterios que se deben cumprir para que un axente (entendéndoo como a entidade capacitada para deliberar e actuar) teña preferencia por unha opción fronte a outra, atendendo ás circunstancias xenéricas que se poidan dar.

Dentro da teoría da decisión racional podemos distinguir, por unha banda a referida a un só actor, e por outra, a de máis dun actor. En relación á primeira atopamos a teoría paramétrica da decisión onde temos situacións de certeza, risco ou incerteza, dependendo da información que teña o axente, sendo completa no primeiro caso e incompleta no segundo e no terceiro. Cando falamos de máis dun actor, podemos distinguir a teoría estratéxica da decisión (ou teoría de xogos), sendo as decisións interdependentes dos outros individuos, e teoría da eleccións social pola que se propoñen criterios que engaden funcións individuais da decisión nunha soa función social de decisión.

Por último, esta teoría caracterízase por unha concepción de racionalidade que avoga por unha actuación racional dos individuos en contraposición ao que é habitual na toma de decisións das persoas no seu día a día.

Distinción entre teoría normativa e descritiva[editar | editar a fonte]

A teoría da decisión racional trata o tema das eleccións levadas a cabo por un axente, este será entendido como unha entidade que ten capacidade de deliberar e actuar. Estamos polo tanto no ámbito do razoamento, no cal as eleccións de cada axente veranse determinadas polas súas vivencias persoais e preferencias subxectivas (crenzas, valores ou desexos). Esta teoría busca establecer criterios racionais á hora de examinar as decisións, xa sexan complexas ou banais e como se vencellan as diversas actitudes de preferencia.[1]

Atopámonos con dúas vertentes principais, por unha banda, a teoría normativa (na que se centrará a entrada principalmente) onde se buscan os criterios de como establecer as formas de actuar que os axentes deberían seguir, mais sen esquecer que outra das ramas sería a descritiva, que trata o estudo de como se toman as decisións ou a prescritiva, que trata de como poden elixir ben individuos reais.

Isto provocará que se traten as diferentes concepcións da probabilidade, o tratamento da incerteza ou a teoría da utilidade esperada (TUE) na busca da racionalidade, sendo estes os grandes focos de debate no eido académico na actualidade. Dado que as preferencias non son o único factor a considerar nas decisións, na análise da teoría da decisión estudaranse diferentes tipos de razón prácticas, como son as razóns pro tanto, razóns en favor ou en contra de facer algo.[2]

Na actualidade o modelo de decisión máis amplamente aceptado é o modelo UE, baseado nun conxunto de axiomas establecidos por L. Savage que no seu conxunto garantirían a toma dunha decisión consistente. Aínda que amplamente defendido, este modelo tamén contará con dificultades non superábeis e diferentes críticas por parte, principalmente, da teoría da racionalidade limitada.[3]

A teoría da decisión será transversal a outras disciplinas, dende a economía á bioloxía, pasando pola filosofía, entre outras. Isto vén dado pola relevancia que posúe na praxe, como poden ser os métodos estatísticos e econométricos ou determinadas cuestións vencelladas á teoría de xogos. A teoría da decisión racional, en definitiva, busca establecer cales serían as mellores decisións racionais considerando a maior cantidade de información relevante posíbel.

Criterios para a toma de decisións[editar | editar a fonte]

As consecuencias dos nosos actos non só dependen das decisións que tomamos, senón tamén dos estados das cousas que suceden máis aló do noso alcance. Ás veces tomamos decisións sabendo o que vai pasar se decidimos unha cousa a outra. Pero non sempre é así. A maior parte das nosas decisión realízanse en situacións nas que non sabemos que vai ocorrer se actuamos dun modo ou outro. De maneira que a nosa decisión ten que ter en conta a probabilidade.[4]

Elección considerando probabilidades:[editar | editar a fonte]

Pode acontecer a situación hipotética de que, un día saíndo da casa non saibamos se saír co paraugas ou non. Se saímos con paraugas e non chove, o noso benestar sería un pouco maior a que se saímos con el e chove. No caso de non saír co paraugas, se chove, causaríanos un gran prexuízo en comparación; se non chove, sería a mellor situación posible. O destacábel neste exemplo sería que non levar paraugas causaría picos de valor ou desvalor (en función de se chove ou non chove), en cambio, levar paraugas produciría un valor máis uniforme. Sería algo tal que así:

Levo paraugas:

  • (1) Chove: 10
  • (2) Non chove: 11

Non levo paraugas

  • (1) Chove: 0
  • (2) Non chove: 14

Supoñendo que soubésemos que a probabilidade de que chova é de 0,8 e a de que non de 0,2, neste caso a mellor opción sería levar paraugas. Ou polo menos iso é o que concluiremos se avaliamos utilizando o concepto de valor esperado.

O valor esperado dunha certa acción: a suma dos distintos valores esperados para cada estado de cousas se se realiza tal acción multiplicados en cada caso pola probabilidade de que suceda. Cada un dos respectivos distintos estados de cousas.

Así, a comparación do que sucede no caso do paraugas podemos representala así:

  1. O valor esperado de levar paraugas é: (11 x 0.2) + (10 x 0.8) = 10.2
  2. O valor esperado de non levar paraugas é: (14 x 0.2) + (0 x 0.8) = 2.8

Polo tanto, neste caso que acabamos de analizar, o valor esperado de levar paraugas nunha situación na que a probabilidade de que chova é de 0,8 é claramente maior que o de non levalo.

No entanto, poderíamos preguntarnos o seguinte: a partir de que probabilidade de que chova é racional levar paraugas dada a asignación de valores de benestar feita arriba? Se realizásemos tal cálculo o resultado sería de aproximadamente 0,769. O cal implicaría que se queremos maximizar o noso benestar, sería racional levar paraugas se a probabilidade de que non chova é menor de 0,769, e non levar paraugas se é maior.

Agora ben, isto non supón que o mellor sexa facer sempre o que maximiza o valor. Isto dependerá de que principio sigamos. Un criterio posíbel é o que vimos arriba de maximizar o valor, esta é a posición utilitarista. Pero podemos seguir outros criterios como tratar de reducir o noso desvalor. Neste caso sería preferíbel ir sempre con paraugas porque o noso maior desvalor estaría en non levar paraugas. Supoñamos en cambio que prefiramos unha opción que nos permita chegar ao máximo de valor, isto levaríanos a decidir non levar paraugas pois o maior pico de valor estaría nesta opción.[4]

Ata o momento, tan só consideramos os valores finais que é esperábel obter. Isto cambiaría se tivésemos valores instrumentais como o diñeiro. Supoñamos un caso no que temos que decidir entre tres opcións (a, b, c) nun escenario no que hai tres estados de cousas posíbeis: f, con probabilidade de 0,79; g, con probabilidade de 0,01; e h, con probabilidade de 0,2. En cada unha destas situacións obteríamos certa cantidade de diñeiro, tal que así:

A)

  • F: 0,79; 100
  • G: 0,01; -100
  • H: 0,2; 150

B)

  • F: 0,79; 30
  • G: 0,01; 30
  • H: 0,2; 30

C)

  • F: 0,79: 10
  • G: 0,01: 300
  • H: 0,2: 100

Quen busque maximizar a maior cantidade de diñeiro esperábel optarán pola opción a). Se se busca maximizar o mínimo de diñeiro obtíbel elixirá b), na que a peor opción é menos mala. E, á súa vez, quen trate de acadar a máxima cantidade de diñeiro optaría por c), pois é o pico máis alto de diñeiro. Mais dependendo das nosas circunstancias as nosas decisión vense condicionadas. Se o que queremos conseguir mediante o diñeiro custa 30, optariamos por b); se custa entre 31 e 150 preferiríamos a); e, finalmente, se custase 151 ou máis, teríamos que escoller necesariamente a opción c).

Criterios de decisión en situacións de incerteza[editar | editar a fonte]

Fernando Aguiar fai referencia á distinción que establece F. Knight entre risco e incerteza. Unha situación de risco caracterízase pola carencia de certeza sobre o resultado final da decisión, aínda que si que se coñece unha certa probabilidade de resultados alternativos (por exemplo, a elección entre cara o cruz nunha moeda). En cambio, nunha situación de incerteza, non só descoñecemos o resultado final, senón que tampouco podemos predicilo en termos de probabilidades obxectivas.

Deste xeito, un dos obxectivos que a teoría da decisión persegue vai ser o estabelecemento dalgún criterio de decisión para actuar nas situacións de incerteza. Distinguiremos entre catro criterios para abarcar esta problemática.

  • Criterio maximín. Ao descoñecer as probabilidades dos sucesos, o que nos aconsella este criterio é seguir aquela acción que nos asegure o máximo dos mínimos, é dicir, a acción que nos libre do peor resultado posíbel. O criterio maximín compara os peores resultados de cada opción posíbel e escolle o mellor deles. En palabras de Aguiar “trátase dun criterio “conservador” pois desperdicia boa parte da información ao ter en contra soamente os peores resultados de cada opción”.
  • Criterio maximax. Ao contrario do criterio maximín, este só ten en conta o mellor resultado posíbel de cada acción, é dicir, o máximo dos máximos. Aínda así, adoece do mesmo defecto que o criterio anterior: non ten en conta boa parte da información ofrecida pola situación.
  • Criterio de Hurwiez. En aras de evitar as dificultades ás que se enfrontan os criterios anteriores, Hurwiez propuxo unha alternativa baseada na suma ponderada dos resultados extremos das liñas de acción.

Tendo en conta o seguinte exemplo exposto por Aguiar e sendo A e B dúas posíbeis decisións e C, D e E os seis respectivos resultados posíbeis, que habería que escoller segundo cada criterio?

C D E
A 100 2 1
B 99 98 0

Todos os criterios coincidirían en escoller a opción A, mais tendo en conta as súas propias motivacións. O criterio maximín, defendería tomar a decisión A porque posúe o máximo valor mínimo comparado con B. Pola contra, o criterio máximax, optaría pola situación A xa que dispón do mellor resultado posible. E o criterio de Hurwiez establecería unha vía intermedia entre ambos en función do grado de pesimismo e optimismo do suxeito elector.

  • Criterio de “razón insuficiente” de Laplace. Esta postura consideraría todos os valores obxectando que carecemos de información de que se dean as situacións C, D os E. Porén, o máis racional sería asignar a mesma probabilidade a cada unha das situacións posíbeis e escoller a que xere a maior utilidade ou valor esperado. Por iso, seguindo este criterio, a mellor opción será a situación B.

En caso de ter en conta non só as decisións incertas en termos probabilísticos e fixar o punto de mira nas posíbeis atribucións subxectivas da citada probabilidade, podemos falar da chamada “modificación bayesiana” do criterio de Laplace. Segundo esta posición, en lugar de conceder a mesma probabilidade obxectiva a cada unha das opcións posíbeis, cabería a posibilidade de que o suxeito elector, por motivacións subxectivas, pensase que algunhas opcións son máis probábeis que outras, de xeito que atribúa así a cada cal unha probabilidade subxectiva.[5]

Que é a probabilidade?[editar | editar a fonte]

Temos que preguntarnos por que é relevante a, asignación de probabilidades e de onde quitamos a asignación de probabilidades para levar a cabo unha elección. Con respecto destas cuestións hai diferentes puntos de vista. Existen certos enfoques que tratan de definir a probabilidade en termos obxectivos. Un destes é a clásica probabilidade apriorística.[5]

A probabilidade apriorística dinos que a probabilidade de que algo suceda é o número de casos posíbeis nos que isto sucede, dividido polo número de casos posíbeis totais.

Existe outra perspectiva que é a chamada probabilidade frecuentista. Esta concepción dinos que a probabilidade de que algo aconteza é a frecuencia coa que isto sucede con respecto aos casos totais acontecidos.

Este é un enfoque cunha base empírica, pois cando se repite o marco xeral no que un evento pode suceder unha e outra vez, ao final acabamos por ver que os casos nos que tal evento se dá se estabilizan nunha determinada frecuencia. Por exemplo, a probabilidade de que unha moeda saía cara ou cruz é 0.5.

Xunto con estes enfoque que acabamos de expor, existe outra perspectiva, é a chamada probabilidade subxectiva.

A probabilidade subxectiva dinos que a probabilidade de que algo aconteza que un axente ten considerado nas súas decisións é aquela que tal axente lle asigna. Esta probabilidade consiste na estimación que os axentes podemos realizar do probábel que é que algo aconteza.

Pode defenderse a probabilidade subxectiva dende posicións metafísicas que neguen a existencia da probabilidade obxectiva. O que sosteñen os defensores deste punto de vista é que na práctica a probabilidade que conta é a que asignamos subxectivamente. Cando temos que tomar decisións nas que non sabemos o que vai suceder tomámolas atribuíndolles probabilidades que son subxectivas. Por exemplo estimamos probabilidades de se vai chover ou non para saber se debemos levar paraugas. Neste caso moita xente decide levalo ou non en base a distintas expectativas de que chova ou non. Isto supón tomar tal decisión en función das probabilidades que subxectivamente estimamos.[5]

Para tomar unha decisión na que o resultado pode variar en función de estados de cousas máis alá do noso control, temos que asignar probabilidades de que suceda un de tales estados de cousas. Faremos isto coa mellor información da que dispoñamos, e revisaremos o noso xuízo cando obteñamos algunha información nova. E en última instancia teremos que decidir en base á nosa asignación de probabilidades. A maioría das veces temos que tomar decisión sen saber que estado de cousas acontecerá, de tal xeito que, queiramos ou non, non temos unha alternativa mellor á de ter que tomar as nosas decisións en función do que nos parece máis ou menos probable.[5]

A probabilidade subxectiva na toma de decisións[editar | editar a fonte]

Respecto á probabilidade, atopamos unha problemática moi común: como proceder nos casos nos que temos moitas dúbidas acerca do conxunto de cosas que puideran acontecer. O espectro de opcións con respecto ao nivel de asimilación da probabilidade é variábel, pero o máis probábel é o seguinte:

  • Aceptar a probabilidade de que algo aconteza: ata que punto é asimilábel dita probabilidade puidera ser unha situación demasiado complexa, con moitos factores posíbeis a ter en conta, ou a dificultade de ofrecer valor relativo sobre certos elementos…; tamén poderíamos estar nunha situación na que non puidesemos contar cos recursos para poder calculala ou nin sequera poder tela en conta.
  • Ás veces, simplemente actuamos ignorando todos eses factores que consideramos imposíbeis de saber. A teoría da decisión di que actuar dese xeito equivale a asignar probabilidades de 0 aos estados de cousas nos que ditos factores efectivamente alteran os resultados esperados.
  • Noutras, podería ocorrer que, cando actuamos e descoñecemos por completo ditos factores ou que puideran ter efecto, a teoría das decisión dinos que non temos a certeza de que sexa imposíbel que eses factores non actúen, igual que non temos a certeza de que si o fagan. A nosa incerteza é igual en ambas as situacións. Descoñecendo así a situación, a probabilidade podería ter calquera valor coma ningún.
  • Supoñamos que a nosa incerteza acerca da probabilidade dos factores é a mesma en todos os casos. e supoñamos que os efectos en direccións contrarias de tales factores teñen o mesmo peso. Nun caso así, podemos considerar que o peso dos diferentes factores se cancela entre si. En tal situación sí sería adecuado actuar como se no existisen eses factores .

O máis relevante deste caso é que moitas veces, a pesar das dificultades que podemos atopar para asignalas, estas nunca parten dun valor 0 e, se dalgunha forma existira, tería que ser incentivado pola imposibilidade de que se desen estados de cousas nos que, no caso da campaña, existira o factor de que animar a doar máis danase a campaña, posíbel por outra banda. Máis non só iso, tamén suceden casos nos que non podemos ter unha noción que máis ou menos se asemelle ao probable, por moi vaga que sexa, e, véndonos na prerrogativa de tomar unha decisión, asignámola. Como consecuencia, e póndonos nun caso hipotético de elixir a ou b , calcular as probabilidades vese como algo necesario para tomar a decisión de escoller a mellor opción esperábel e, como consecuencia, calcular en que rango cae a probabilidade estimada, converténdose o resultado exacto en algo irrelevante pero non así a certeza da estimación.[4]

A maiores de todas estas premisas, temos que ter en conta que as probabilidades non son permanentes e a acollida de nova información sempre condiciona, posicionándonos ante un novo marco e obrigándonos á reorganización do cadro de posibilidades axustado a esta nova información.

Polo tanto, unha vez asignemos a un evento unha posibilidade de 0 ou de 1 é algo que debemos de reflexionar profundamente, xa que desta maneira asigna a posibilidade (1) ou imposibilidade (0) de que dito evento suceda. Esta reflexión sempre ten que estar aberta a unha nova chegada de información, convertendo probabilidades practicamente nulas (0,0001) en estimacións a posteriori moi altas, mentres que no caso de imposibilitala xa nos veríamos por sempre pechados a este suceso. Para rematar, cabe recordar que todas estas cuestións se moven nun plano teórico e normativo da teoría da decisión en Filosofía, ou sexa, indica a modo de manual como deberíamos de tomar as nosas decisións, pero non explica o por que de como actuamos (xa que moitas veces actuamos de maneira irracional). Danse situacións en que individuos teñen distintos fins que entran en conflito e para maximizar o cumprimento destes deberemos de estudar o modo en que cremos que actuarán, neste plano entra a teoría de xogos. Pero tamén hai outras nas que o mellor para ambos sería buscar a maximización colectiva dos fins que temos, nas que entrarían teorías como a da elección social tan importantes na democracia no ámbito político por exemplo, na que podemos sacar quen é a mellor decisión para elixir.

A teoría de xogos na toma de decisións[editar | editar a fonte]

A teoría de xogos adicase a estudar as interaccións (xogos) entre entidades (xogadores) que teñen unha serie de intereses e toman decisións considerando non só as propias senón tamén as decisións e intereses do resto de xogadores. Pode clasificarse como unha parcela da teoría da decisión. Algúns teóricos de xogos sosteñen que moitos dos exemplos de teoría da decisión poden analizarse como xogos unipersonais nos que o Mundo ou a Natureza sería un xogador non-interesado pero si sensíbel de ser analizado e predito. En xeral, dicimos que un xogo é unha interacción entre polo menos dous xogadores, individuos ou colectivos, que se esforzan por anticipar os movementos do resto de xogadores implicados e adiantarse nas súas decisións. Neste sentido o póker é un xogo, mais (falta engadir un exemplo de xogo que non sea xogo)[5]

Xogos[editar | editar a fonte]

Existen múltiples exemplos para ilustrar a mecánica dos xogos. Desde un penalti, onde temos un xogo de dous xogadores, lanzador e porteiro, que tentan “adiviñarse” as intencións mutuamente para tomar a decisión con maior probabilidade de éxito, ata o coñecido Dilema do Prisioneiro, que ten numerosas variantes; dúas empresas que compiten polo monopolio, dous estados armamentísticos que deben decidir se cooperar ou autodestruírse etc. Os xogos permiten contidos diferentes porque son formais. Todos contan cunha estrutura similar. A matriz de pagos é un esquema no que se representan unha serie de valores posíbeis para cada xogador resultantes de cada xogo.[5]

Clasificación formal[editar | editar a fonte]

As variables formais determinan o campo de posibilidades do xogo. O número de “xogos” movementos ou “tiradas”, como se diría popularmente,  establece a lonxitude do xogo. Hai xogos dun só movemento como poden ser algúns exemplos bélicos: vida ou morte. E hai xogos lentos e case infinitos como algúns xogos políticos. Ademais, o número de xogadores determina tamén o ritmo, as estratexias posibles e óptimas, a intensidade, as recompensas ou perdas exponenciais etc. A distribución daquilo que está en xogo determina se se trata dun Xogo de Suma Cero, no que  un xogador gaña unha cantidade idéntica á que outro xogador perde. Os xogos poden xogarse simultaneamente, de modo que todos os xogadores deben decidir e actuar á vez, ou secuencialmente, de maneira que cada xogador intervén na súa quenda considerando os movementos anteriores —coñecidos— e calculando os movementos futuros do resto. Outro factor é a información que se desprende do xogo e dos movementos dos xogadores. Hai xogos de información perfecta porque operan nun sistema pechado como o xadrez no que un xogador (2) coñece porque presencia o movemento de (1) e viceversa. Este sería ademais un xogo secuencial. Na maioría de xogos simultáneos non é posíbel tal grao de información.[5]

Desenvolvemento[editar | editar a fonte]

Esta teoría naceu no seo da economía, aínda que a día de hoxe ten aplicación en diversos campos. Os tres autores máis notábeis foron Von Neumann, Morgenstern e John Nash. Os dous primeiros poden considerarse creadores da teoría de xogos. O terceiro, Nash, ideou unha das estratexias máis influentes, o equilibrio de Nash. Outro autor moi relevante é Kenneth Arrow que, sobre o traballo de Neumann e Morgenstern, postulou o teorema de Arrow e deu pé aos estudos da teoría de elección social.

Criterios[editar | editar a fonte]

Á hora de elaborar ou analizar estratexias é moi importante establecer criterios. Algúns criterios de teoría de xogos son o Equilibrio de Nash (que ten lugar cando cada xogador toma a mellor decisión de acordo coa mellor decisión de todos os demais de modo que non hai cabida á sorpresa porque ninguén pode cambiar de estratexia para gañar máis), “ maximin” e “minimax” (maximizar a menor ganancia ou minimizar a maior perda esperadas) e Pareto (que tenta evitar o Suma Cero, é dicir decide parar cando o seu beneficio é proporcional ao prexuízo do outro ou outros).[5]

Paradoxos da toma de decisións[editar | editar a fonte]

Paradoxo de San Petesburgo[editar | editar a fonte]

Considérese tomar parte no seguinte xogo se se paga certa cantidade de diñeiro por participar. Ao lanzar unha moeda ao aire, se sae cara págaselle ao xogador 2 euros; se sae cruz vólvese a lanzar a moeda, esta vez sendo dobre o premio. Desde xeito, cando o xogador perde, o premio dobrarase, e así ata que este gañe. Canto estaría disposto a pagar o xogador por participar deste xogo? O razoábel parece que sería sumar o que se pode gañar pola probabilidade de gañalo, sendo o que se pague por xogar o resultado desa suma (o valor esperado).[5]

A probabilidade de gañar 2 euros no primeiro lanzamento é ½, a de gañar catro na segunda ¼, e así sucesivamente:

(1/2*2) + (1/4*4) + (1/8*8)+…=1+1+1+111= ∞

Parece entón que matematicamente debería pagarse unha cantidade infinita, cando na realidade ninguén tomaría dita decisión. Isto é coñecido como o Paradoxo de San Petersburgo e foi resolta polo matemático Bernoulli no século XVIII. Primeiro estableceu que existe unha relación entre o aumento dos ingresos dunha persoa e a valoración dos ingresos que esta fai. É dicir, que a medida que aumentan os ingresos, a persoa valora menos ter aínda máis ingresos, o que provoca que o que valora sexa non perdelos. En termos matemáticos isto implica que a función que relaciona a utilidade esperada e a riqueza é logarítmica, o que implica que ten unha asíntota á que os valores tenden a partir de certo punto. Esta asíntota sería o nivel ideal de utilidade que alguén podería alcanzar. Porén, a utilidade esperada do xogo sería finita, e por tanto só se pagaría unha cantidade finita por participar no xogo.

Como vemos, no xogo achámonos nunha situación de incerteza (distíngase de risco). En principio podería parecer que é arbitrario que se a probabilidade é subxectiva dependa só do que o suxeito estableza como con determinada probabilidade certos estados de cousas posíbeis. O que a solución deste paradoxo supón é precisamente a compatibilización das matemáticas coas avaliacións subxectivas sobre os estados futuros incertos, así como unha xeneralización da regra do valor esperado.[5]

É xa no século XX cando cos traballos de Savage e Von Neumann, Morgenstern e Savage, que os resultados de Bernoulli se constitúen como unha teoría capaz de medir as probabilidades que, en contextos de incerteza, un suxeito pensa sobre as consecuencias das súas decisións. En particular, Savage mostrou que as nosas decisións han de cumprir certas condicións para que poidamos derivar delas probabilidades subxectivas e utilidades cardinais ou medíbeis. Estas condicións son unha serie de axiomas reunidas polo modelo USE (das siglas SEU, do inglés Subjective Expected Utility). Os seis primeiros axiomas son os seguintes:

  • Axioma 1. Completude (completeness): Para todo x e todo y, ou ben x é preferida a y, ou y é preferida a x, ou o individuo é indiferente a elas.
  • Axioma 2. Transitividade: Para todo x, y e z, se x é preferida estritamente a y e y é preferida estritamente a z, será preferida a z.
  • Axioma 3. Independencia das alternativas irrelevantes.
  • Axioma 4. Independencia das consecuencias contrafácticas: tomar a decisión de levar a cabo unha acción con certas consecuencias depende só da preferencia polas consecuencias reais que tivera, e non polas que puidera ter.
  • Axioma 5. Independencia con respecto á ganancia esperada: a decisión debe basearse na probabilidade de gañar, e non na cantidade a gañar.
  • Axioma 6. Preferencia estrita mínima: existe ao menos un par de consecuencias das que unha é preferida estritamente á outra.

Ben é certo que o modelo permite que o suxeito estableza as probabilidades. É dicir, que parte dunha concepción da probabilidade subxectiva. Así se permite, tamén, que ás consecuencias podamos atribuírlles utilidades medíbeis.

Con todo, tense criticado do modelo de Savage que formula uns canons de racionalidade, quere dicir, que é normativo, xa que establece como debería actuar un suxeito para ser racional. Por exemplo, un suxeito sería racional, de acordo con este modelo, se maximiza nas súas decisión a utilidade máxima esperada.

Notas[editar | editar a fonte]

  1. Dreier, J. (1996). "Rational preferences: decision theory as a theory of practical rationality". Theory and Decisions 40: 249–276. 
  2. Resnik, D. (1987). Choices: An Introduction to Decision Theory. Minneapolis: UMP. 
  3. Aguiar, F. (2004). "Teoría de la Decisión e Incerticumbre: Modelos Normativos y Descriptivos". EMPIRIA. Revista de metodología de ciencias sociales 8: 139–60. 
  4. 4,0 4,1 4,2 Buchak, Lara (2013). Risk and rationality. Oxford University Press. 
  5. 5,0 5,1 5,2 5,3 5,4 5,5 5,6 5,7 5,8 5,9 Peterson, Peterson (2009). An Introduction to Decision Theory. Cambridge University Press.