Bellman Optimalitätsprinzip < Diskrete Mathematik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 16:03 Mi 15.04.2015 | Autor: | magicus |
Aufgabe | Beweise das, wenn [mm] $V_1(s) \leq V_2(s) \forall [/mm] s$, wobei [mm] $V_1$ [/mm] und [mm] $V_2$ [/mm] zwei verschiedene Wertefunktionen sind, gilt für alle Zustände s [mm] $(B^\*V_1)(s) \leq (B^\*V_2)(s)$.\\
[/mm]
[mm] \\
[/mm]
Wobei [mm] $(B^\*V)(s) =\max_a[R(s,a) [/mm] + [mm] \lambda \sum_{s'} [/mm] Pr(s'|s,a)V(s)]$ |
Meine Frage währe wie ich einen Anstaz finden kann diesen Beweis zu liefern. Wie kann ich das [mm] $max_a$ [/mm] wegarbeiten? Ich denke ich kann damit arbeiten das für alle Zustände [mm] $V_1$ [/mm] kleiner ist als [mm] $V_2$, [/mm] aber ich bräuchte einen Tip wie ich ansetzen kann. Danke
Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt.
|
|
|
|
Hiho,
> Wie kann ich das [mm]max_a[/mm] wegarbeiten?
was hindert dich daran die Ungleichung ohne das Max zu zeigen?
Dann folgt die Ungleichung doch sofort.
Gruß,
Gono
|
|
|
|