分享到plurk 分享到twitter 分享到facebook

版本 c0cd75cca7bb71ca65c066cf483fc011fefeba6c

acm/course/DP

Week 5: Solving Strategy 2(DP)

定義

dynamic programming (also known as dynamic optimization) is a method for solving a complex problem by breaking it down into a collection of simpler subproblems, solving each of those subproblems just once, and storing their solutions - ideally, using a memory-based data structure * Reference to https://en.wikipedia.org/wiki/Dynamic_programming

DP全名為 Dynamic Programming (動態規劃) ,將問題切分多個子問題,簡化問題的複雜度,最後將所以子問題合併得到解答。

特性

If the problem also shares an optimal substructure property, dynamic programming is a good way to work it out.
* Reference to Overlapping_subproblems

** DP的題目有兩個重要的特性 ** 1. Optimal Substructure (最佳子問題) 2. Overlapping Subproblem(子問題重疊)

Q. Why memorization is ineffective in speed up a good divide-and-conquer algorithm such as MERGE_SORT ?

sol) without overlapping. 如果沒有重疊的子問題,我們會發現時間複雜度並不會因為使用DP而降低,這是因為每次的子問題並沒有重複得部份!

Example

Coin Change (錢幣交換)

想法:

dp[i]:i 價位是否可以湊的 (false/true) v[k]:第k種硬幣

如果i-v[k]價位可以湊得,那麼i必定也可以湊得 ** If (dp[ i – v[k] ] == true) dp[ i ] = true; **

每種硬幣數量的差異:
  1. 1 個硬幣
    • dp 的 index 由大到小掃過進行更新。

    • 圖示:N = 1,意即每個硬幣有 1 個。

  2. N 個硬幣
    • dp 的 index 由大到小 N 次

    • 圖示:假設 N = 2,意即每個硬幣有 2 個。

  3. 無限硬幣
    • dp 的 index 由小到大掃過進行更新。

    • 圖示:硬幣有無限多個。

如果題目為湊得該價位有幾種方法,dp所紀錄的是方法數,dp[0]為1,不斷累加方法數到i==該價位 If (dp[ i - v[k] ] == true) dp[ i ] += dp[ i - v[k] ]; =============

0/1 Knapsack Problem (0-1背包問題)

Knapsack Problem:背包問題

將一堆物品塞進背包,要使背包裡的物品總價值最高,

但背包有耐重限制,所以塞的太重的話,背包就會撐

破。

0/1:

物品只會放進背包0個或1個,物品不可切割,所以只

有不放或者全放兩種可能。

想法:

dp[m]:在m重量下目前的最佳價值

v[i]:物品i的價值

w[i]:物品i的重量

** 類似硬幣交換的作法,不過dp[m]所紀錄的是目前使用i種物品在m重量可以得到的最佳價值,當發現某物品在相同重量下可以創造更佳的價值就進行更新

dp[m] = max( dp[m], dp[m - w[i]] + v[i] );

DP v.s Greedy Algorithm

Greedy 相較 DP 多出一個性質 - Greedy Choice,即每次只要挑選最佳的選擇,最後必定可以得到最佳解。

如果今天一件物品可以任意分割成數份,此問題變成為fractional背包問題,因為沒有最後一個物品塞不下的問題,每次只要挑選最高性價比(CP值)的物品,最終一定可以達到最高價值。

此問題與0/1背包問題差別就在於fractional背包問題有Greedy Choice特性,因此可以用速度更快的Greedy Algorithm來得到解。