分享到plurk 分享到twitter 分享到facebook

版本 c921b8861a339b41cfff36a9e09acf98bf4c22b6

acm/course/DP

Changes from c921b8861a339b41cfff36a9e09acf98bf4c22b6 to 8ad05f098795f06eefe47a37ef4913e7910b290d

Week 5: Solving Strategy 2(DP)
===========
Dynamic Programming
======================
dynamic programming (also known as dynamic optimization)  is a method for solving a complex problem by breaking it down into a  collection of simpler subproblems, solving each of those subproblems  just once, and storing their solutions - ideally, using a memory-based  data structure
* Reference to https://en.wikipedia.org/wiki/Dynamic_programming

DP全名為 Dynamic Programming (動態規劃) ,將問題切分多個子問題,簡化問題的複雜度,最後將所以子問題合併得到解答。
=========

特性
=============

If the problem also shares an [optimal substructure](https://en.wikipedia.org/wiki/Optimal_substructure) property, [dynamic programming](https://en.wikipedia.org/wiki/Dynamic_programming) is a good way to work it out.
* Reference to [Overlapping_subproblems](https://en.wikipedia.org/wiki/Overlapping_subproblems)

DP的題目有兩個重要的特性
-------
1.Optimal Substructure (最佳子問題)

2.Overlapping Subproblem(子問題重疊)

Q. Why memorization is ineffective in speed up a good divide-and-conquer algorithm such as 
MERGE_SORT ?

sol) 
without overlapping. 如果沒有重疊的子問題,我們會發現時間複雜度並不會因為使用DP而降低,這是因為每次的子問題並沒有重複得部份!
==================

Example
================

Coin Change (錢幣交換)
-------
想法:

dp[i]:i 價位是否可以湊的 (false/true)

v[k]:第k種硬幣

** 如果i-v[k]價位可以湊得,那麼i必定也可以湊得

If (dp[ i – v[k] ] == true) dp[ i ] = true;

每種硬幣數量的差異:
<ol>
<li> 1 個硬幣</li>

+ dp 的 index 由大到小掃過進行更新。

+ 圖示:N = 1,意即每個硬幣有 1 個。

    

   
<li> N 個硬幣</li>

+ dp 的 index 由大到小 N 次

+  圖示:假設 N = 2,意即每個硬幣有 2 個。

<li>無限硬幣</li>

+ dp 的 index 由小到大掃過進行更新。

+ 圖示:硬幣有無限多個。

</ol>

如果題目為湊得該價位有幾種方法,dp所紀錄的是方法數,dp[0]為1,不斷累加方法數到i==該價位
If (dp[ i - v[k] ] == true) dp[ i ] += dp[ i - v[k] ];
=============


0/1 Knapsack Problem (0-1背包問題)
-------------
Knapsack Problem:背包問題

將一堆物品塞進背包,要使背包裡的物品總價值最高,

但背包有耐重限制,所以塞的太重的話,背包就會撐

破。


0/1:

物品只會放進背包0個或1個,物品不可切割,所以只

有不放或者全放兩種可能。

想法:

dp[m]:在m重量下目前的最佳價值

v[i]:物品i的價值

w[i]:物品i的重量

** 類似硬幣交換的作法,不過dp[m]所紀錄的是目前使用i種物品在m重量可以得到的最佳價值,當發現某物品在相同重量下可以創造更佳的價值就進行更新

dp[m] = max( dp[m], dp[m - w[i]] + v[i] );



DP v.s Greedy Algorithm
============================

Greedy 相較 DP 多出一個性質 - Greedy Choice,即每次只要挑選最佳的選擇,最後必定可以得到最佳解。

如果今天一件物品可以任意分割成數份,此問題變成為fractional背包問題,因為沒有最後一個物品塞不下的問題,每次只要挑選最高性價比(CP值)的物品,最終一定可以達到最高價值。

此問題與0/1背包問題差別就在於fractional背包問題有Greedy Choice特性,因此可以用速度更快的Greedy Algorithm來得到解。