středa 12. září 2012

Prospektová teorie a teorie očekávaného užitku


Photograph by Andreas Rentz/Getty Images for Burda Media.
Musím se přiznat, že když jsem knížku Thinking, Fast and Slow četl poprvé, nepochopil jsem úplně přesně k čemu je prospektová teorie (prospect theorydobrá. Existuje přitom spousta důvodů, proč je vhodné vědět co vysvětluje. Právě za prospektovou teorii získal totiž Daniel Kahneman jako první psycholog vůbec Nobelovu cenu za ekonomii. Toto ocenění z roku 2002 přitom nebylo pouze velkým úspěchem pro Daniela Kahnemana. Šlo také o velký úspěch pro celou behaviorální ekonomii a já jsem si proto v duchu slíbil, že se k tématu později vrátím a znovu si ho promyslím.

Prospektovou teorii představili Amos Tversky a Daniel Kahneman poprvé ve společném článku s názvem „Prospect theory: An analysis of decisions under risk“, který vyšel v roce 1979 v prestižním časopise Econometrica. Článek byl kritikou starší teorie, tzv. teorie očekávaného užitku (expected utility theory), která má původ v první polovině 18. století a která má ambici být deskriptivní i normativní ekonomickou teorií rozhodování v situacích, které zahrnují riziko. Tverského a Kahnemana přitom nezajímalo, zda teorie očekávaného užitku poskytuje dobré rady v otázce jak se rozhodovat, tedy zda je dobrou normativní teorií. Nesouhlasili jednoduše s tvrzením, že starší teorie dobře popisuje to, jak se většina lidí většinou rozhoduje. Jinak řečeno, byli přesvědčeni, že jde o špatnou teorií deskriptivní.

Původní experimenty Tverského a Kahnemana, které předcházely rozvoji prospektové teorie zkoumaly intuitivní odpovědi na dilemata, jako je například toto dilema se dvěma alternativními možnostmi. Sami si přitom můžete vyzkoušet, která z alternativ je pro vás na první pohled atraktivnější:

A. Hodíte mincí. Pokud padne panna, dostanete 100 dolarů. Pokud padne orel, nedostanete nic.
B. Dostanete 46 dolarů

Částka 100 dolarů, kterou můžete vyhrát odpovídá asi 2000 korunám. Jistota 46ti dolarů odpovídá asi 920 korunám. Dilema je samozřejmě zákeřné kvůli tomu, že jde o situaci která zahrnuje riziko, protože při rozhodování nevíte, co vám z dilematu vzejde, pokud si zvolíte možnost A. Pokud by padla panna, získáte 100 dolarů, což je více než 46 dolarů. Pokud by vám ale padl orel, nezískáte nic, což je méně než 46 dolarů. Pokud jste alespoň trochu jako já a jako většina lidí, intuitivně si nejspíše spokojíte s 46ti dolary (920ti korunami), vyberete druhou možnost a riziku se raději vyhnete. Někdo by ovšem mohl říct, že takové rozhodnutí je iracionální.

Teď když víme, že pro většinu lidí je přitažlivější možnost B, můžeme se k dilematu vrátit a zamyslet se nad tím, zda jde skutečně o lepší alternativu. Skoro každého napadne, jak by se dalo rychle spočítat, která z dvou možnosti je doopravdy lepší. Stačí zkrátka vypočítat jaká je očekávaná hodnota obou možností a pak vybrat tu s vyšší očekávanou hodnotou. Očekávanou hodnotu obou možností lze spočítat takto:

A. (100 * 0,5) + (0 * 0,5) = 50
B. (46 * 1) = 46

Přesně toto je způsob, jakým se podobná dilemata řešila nejen před vznikem prospektové teorie, ale ještě mnohem dřív, tedy v době před tím, než v první polovině 18. století vznikla teorie očekávaného užitku. Této nejstarší teorii se říká teorie očekávané hodnoty (expected value theory) a její zastánce je zavázán preferovat možnost A. před možností B., čímž se samozřejmě dostává do sporu s pozorováním, že většina lidí si volí naopak možnost B. Z pohledu teorie očekávané hodnoty se tedy zdá, že většina lidí jsou špatnými přirozenými statistiky a že projevují iracionální averzi k riziku (risk aversion). Averze k riziku se projevuje tak, že lidé někdy preferují jistou věc před možností která zahrnuje riziko i v případech, že je možnosti zahrnující riziko přiřazena vyšší očekávaná hodnota. Například v našem dilematu lidé projevují (zdánlivě) iracionálně ochotu oželet nebo „zaplatit“ 4 dolary ze svého očekávaného užitku za to, aby se riziku vyhnuli.

Obě mladší teorie, teorie očekávaného užitku a prospektová teorie, souhlasí s popisem z pohledu teorie očekávané hodnoty v tom, že lidé skutečně projevují averzi k riziku. Nesouhlasí ale s tím, že averze k riziku je iracionální. Hodnoty jako 46 dolarů, 100 dolarů nebo 0 dolarů se kterými pracuje teorie očekávané hodnoty jsou totiž podle teorie očekávaného užitku pouhá čísla, která sama o sobě pro konkrétní lidi téměř nic neznamenají. Důležitý je samozřejmě kontext, tedy to, jaký užitek konkrétnímu člověku dalších 46, 100 nebo 0 dolarů přinese. V extrémním případě si lze například představit člověka, pro kterého by zisk 46 dolarů znamenal rozdíl mezi několika dny hladovění a několika dny hodování. Právě od takového člověka by přitom bylo jen a jen racionální, kdyby si vybral spíše jistých 46 dolarů a oželel naděje na zisk 100 dolarů a to prostě proto, že by zároveň riskoval nesmírně nepříjemnou alternativu, že nedostane nic a bude hladovět.

Nejde však ale jen o krajní příklady extrémně chudých lidí. Zákon klesajícího mezního užitku z bohatství, se týká všech lidí ve všech situacích. Tvrzení: "Čím více vlastníte tisícikorun, tím menší radost budete mít z další tisícikoruny kterou získáte" platí jak pro chudáky, tak pro boháče. Vztah celkového užitku k bohatství vyjadřuje asi takováto křivka, kterou zná každý ze základního kurzu ekonomie:


Jak si lze všimnout, celkový užitek z bohatství roste ze začátku velmi rychle, postupně se tempo jeho růstu zpomaluje, ale nikdy se nezastaví a celkový užitek nikdy nezačne klesat. Jinak řečeno, vaše první tisícikoruny jsou pro vás velmi užitečné, můžete si za ně koupit spoustu užitečných věcí, jako je jídlo, voda, elektřina a střecha nad hlavou. Když máte ale tisícikorun hodně, nezbývá vám než je utrácet za věci, které neznamenají už tak markantní změnu vašeho celkového užitku jako jsou smartphony, elektronické čtečky a tablety. A právě fakt, že křivka celkového užitku roste čím dál pomaleji ukazuje proč je averze k riziku v našem případě racionální. Stručně řečeno, zisk 46ti dolarů pro většinu lidí znamená větší mezní užitek než je polovina mezního užitku ze 100 dolarů. Volba jistých 46 dolarů tedy maximalizuje užitek, což je v ekonomii jiný způsob jak říct, že je racionální. Lidé tedy možná nejsou přirozenými statistiky, zdá se ale, že jsou alespoň dobrými přirozenými ekonomy.

Zatím jsme si tedy ukázali v čem spolu obě novější teorie souhlasí. Jak prospektová teorie, tak teorie očekávaného užitku předpovídají, že v situacích, kdy jsou obě alternativy dobré budou lidé projevovat jistou averzi k riziku a to kvůli zákonu klesajícího mezního užitku z bohatství. Mnohem zapeklitější problém je ale pochopit, v čem se prospektová teorie od teorie očekávaného užitku liší. Mě osobně velmi pomohlo srovnání dvou grafů, které popisují stejné situace z pohledu obou teorií.

V obou případech tvoří průsečík os x a y referenční bod, tedy určité dané bohatství (určitý počet tisícikorun), které právě teď někdo má. Napravo od průsečíku na ose x jsou zaznamenány kladné změny bohatství (zisky určitého počtu dalších tisícikorun), na levou jsou naopak záporné změny bohatství (ztráty určitého počtu tisícikorun). Na ose y jsou nahoře kladné očekávané změny užitku nebo psychologické hodnoty (očekáváné zvýšení radosti), dole jsou naopak záporné očekávané změny užitku nebo psychologické hodnoty (očekávané zvýšení smutku).

Můj improvizovaný graf závislosti změny bohatství a změny užitku pro teorii očekávaného užitku vypadá asi takto:




Nejznámější graf behaviorální ekonomie zaznamenávající závislost změny bohatství a změny psychologické hodnoty pro prospektovou teorii pak vypadá takhle:




Pokud bychom se dívali pouze na části obou křivek, které nalezneme v prvním kvadrantu (vpravo nahoře), zjistíme, že vypadají téměř stejně. Obě jsou rostoucí, ze začátku rostou rychle a postupně se jejich růst zpomaluje, nikdy se ale nezastaví a křivka nikdy nezačne klesat. Užitková funkce resp. funkce psychologické hodnoty je konkávní. Za to samozřejmě může právě zákon klesajícího mezního užitku z bohatství, právě proto lidé projevují racionální averzi k riziku a právě tato část grafu popisuje rozhodování v situacích, kdy jsou obě možnosti dobré. Na druhou stranu ale existují mezi oběma grafy minimálně tři zajímavé rozdíly.

Zatímco teorie očekávaného užitku zaznamenává na ose y očekávané změny užitku, prospektová teorie zde zaznamenává očekávané změny psychologické hodnoty. Populárně řečeno jde vlastně o očekávané změny na ose radost-smutek (jako je očekávání zvýšení radosti nebo očekávání zvýšení smutku). Tuto změnu dělá prospektová teorie nejspíše proto, že se zjistilo, že lidské emoční reakce na zisky a ztráty bohužel proporčně neodpovídají ziskům a ztrátám celkového užitku. Lidské emoční reakce zkrátka nejsou optimálně vyladěny tak, aby vedly k rozhodování, které maximalizuje užitek. Proto je sledování změn užitku v situacích, kdy chceme popisovat rozhodování skutečných lidí zavádějící. Místo toho je lepší sledovat změny na ose očekávané radosti nebo smutku, které rozhodování skutečně ovlivňují.

S tím souvisí druhý problém, totiž že v blízkosti průsečíku os x a y (tj. v blízkosti referenčního bodu) křivka v případě starší teorie mezního užitku roste jen velmi pozvolně, kdežto v případě prospektové teorie roste relativně dramaticky. Právě tento rozdíl je jasně viditelným projevem faktu, že emoční reakce proporčně neodpovídají změnám celkového užitku. Pokud by tomu skutečně bylo tak, že emoční reakce odpovídají změnám celkového užitku, museli bychom očekávat, že běžně bohatý člověk bude ke ztrátě nebo zisku několika stokorun emočně indiferentní, protože vzhledem k jeho bohatství taková změna sotva ovlivní jeho celkový užitek z bohatství. To ale samozřejmě není způsob jakým lidé na změny bohatství reagují. Právě strmost růstu hodnotové funkce prospektové teorie v okolí referenčního bodu má vystihovat fakt, že i relativně bohaté lidi dokáže iracionálním způsobem potěšit drobný nečekaný zisk, a že stejné lidi dokáže rozesmutnit nebo rozzlobit i drobná nečekaná ztráta.

Úplně nejdramatičtějším způsobem se ale to, jak se změna užitku a změna psychologické hodnoty rozchází ukazuje v situacích, které nezahrnují pouze riziko, ale také jistou ztrátu. Tento podivuhodný rozdíl je graficky znázorněn v tvaru obou funkcí ve třetím kvadrantu (vlevo dole). Zatímco užitková funkce je zde konkávní, funkce prospektové teorie je konvexní. Za to, že je hodnotová funkce prospektové teorie ve srovnání s racionální křivkou užitkové funkce takto iracionálně pokřivená může zlý kognitivní bias s názvem averze ke ztrátě (loss aversion), který ovlivňuje rozhodování lidí, jejichž volby má prospektová teorie popisovat.

Jak už jsem naznačil, k ilustraci toho, jak averze ke ztrátě vede k iracionálnímu rozhodování slouží nejlépe dilemata, kdy si musíte vybrat ze samých špatných možností. Příkladem může být toto:

Obdržíte 100 dolarů, musíte si ale vybrat jednu z následujících možností:
A. Hodíte mincí. Pokud padne panna, ztratíte 100 dolarů. Pokud padne orel neztratíte nic.
B. Ztratíte 54 dolarů

Jde o dilema, které je podobné tomu, se kterým jsme se seznámili dříve. Sto dolarů znovu odpovídá asi 2000 korun, 54 dolarů je asi 1080 korun a trik spočívá opět v tom, že nevíte, co vám z dilematu vzejde, když si zvolíte možnost A. Pokud by padla panna, ztratíte 100 dolarů, což je horší než ztratit 54 dolarů. Pokud by ale padl orel, neztratíte nic, což je lepší než ztratit 54 dolarů V tomto případě je pro většinu lidí atraktivnější možnost A. Jinak řečeno, lidé v tomto případě projevují ochotu k vyhledávání rizika (risk seeking), což je samozřejmě opak averze k riziku.

Podivnost této preference spočívá v tom, že druhé dilema ve kterém lidé ochotně podstupují riziko je zrcadlovým odrazem našeho prvního dilematu, kde se lidé riziku vyhýbali. V prvním dilematu může volba A. dopadnout buď tak, že vyhrajete 100 dolarů nebo nevyhrajete nic. V dilematu 2 určitě získáte 100 dolarů a vaše volba A. může dopadnout buď tak, že přijdete o 100 dolarů (takže de facto nevyhrajete nic) nebo přijdete o nic (takže de facto vyhrajete 100 dolarů). Při volbě B. v prvním dilematu vyhrajete 46 dolarů. V dilematu 2 při volbě B. určitě určitě dostanete 100 dolarů a určitě ztratíte 54 dolarů (takže de facto vyhrajete 46 dolarů). Možnosti A. a B. jsou v obou dilematech tedy ekvivalentní a používají pouze jinou rétoriku. V dilematu 1 se přitom lidem daří maximalizovat svůj užitek když se vyhýbají riziku, kdežto v dilematu 2 se lidé chovají iracionálně a svůj užitek nemaximalizují, když riziko vyhledávají. Tato iracionální volba je ovlivněna právě averzí ke ztrátě, která působí, že polovina očekávaného smutku ze ztráty 100 dolarů je menší než očekávaný smutek ze ztráty 54 dolarů.

Rozdíl mezi konkávní užitkovou funkcí ve třetím kvadrantu a konvexní funkcí prospektové teorie má rozdílné implikace. Teorie mezního užitku předpokládá, že ztráta první tisícikoruny vám ve srovnání se ztrátou druhé a každé další tisícikoruny nebude až tolik vadit. To vše samozřejmě vyplývá ze zákona klesajícího mezního užitku z bohatství. Behaviorální ekonomie ale zjistila, že lidé se nejvíce snaží vyhnout ztrátě první tisícikoruny a ke ztrátě druhé a každé další tisícikoruny jsou stále indiferentnější. Jinak řečeno, lidé se rozhodují podle toho, že očekávají, že ztráta tisícikoruny bude důvodem k většímu smutku než je polovina smutku ze ztráty dvou tisíc.

Na závěr bych rád připomenul, že konvekčnost hodnotové funkce podle prospektové teorie a fakt, že podléháme averzi ke ztrátě, má právě tu zajímavou implikaci pro otázku placení společných útrat, které si všiml Dan Ariely. Konkrétně jde o otázku, zda je lepší se s partnery nebo blízkými přáteli o společné útraty v restauraci při každém placení spravedlivě dělit, nebo zda je lepší střídat se v placení celé útraty. Pokud by byly naše emoční reakce přímo úměrné úbytku celkového užitku z bohatství spojených s placením účtu, bylo by nejlepší účet si vždy dělit, protože každá další zaplacená desetikoruna by nás „bolela“ více než ta předcházející, takže by pro nás bylo lepší platit často a málo. To, že je hodnotová funkce prospektové teorie konvexní ale znamená, že je lepší platit naopak méně často více peněz naráz. Jinak řečeno je tedy lepší se v placení střídat. Podle prospektové teorie nás totiž naopak nejvíce bolí první zaplacená desetikoruna a každá další nás bolí méně.

BONUS pro věrné čtenáře, kteří vydrželi až do konce:

Motto speciálního BONUSU: "Jeden obrázek vydá za tisíc slov." (Čínské přísloví)