「力扣」第 188 题：买卖股票的最佳时机 IV

发布日期: 2018-04-24

「力扣」第 188 题：买卖股票的最佳时机 IV

给定一个数组，它的第 i 个元素是一支给定的股票在第 i 天的价格。

设计一个算法来计算你所能获取的最大利润。你最多可以完成 k 笔交易。

注意: 你不能同时参与多笔交易（你必须在再次购买前出售掉之前的股票）。

示例 1：
输入: [2, 4, 1], k = 2
输出: 2
解释: 在第 1 天 (股票价格 = 2) 的时候买入，在第 2 天 (股票价格 = 4) 的时候卖出，这笔交易所能获得利润 = 4-2 = 2 。
示例 2：
输入: [3, 2, 6, 5, 0, 3], k = 2
输出: 7
解释: 在第 2 天 (股票价格 = 2) 的时候买入，在第 3 天 (股票价格 = 6) 的时候卖出, 这笔交易所能获得利润 = 6-2 = 4 。
     随后，在第 5 天 (股票价格 = 0) 的时候买入，在第 6 天 (股票价格 = 3) 的时候卖出, 这笔交易所能获得利润 = 3-0 = 3 。

首先需要判断的一点是，一次交易至少需要 2 天，一天买，一天卖。因此如果 k 很大，大到大于等于 len / 2，就相当于股票系列的第 2 题，使用贪心算法去做就可以了。这是一个特判。

这道题用动态规划完成，比之前的股票问题多一个限制，则有后效性，因此可以多设置一个状态去消除这种后效性。

“无后效性”有两层含义：（1）当前做的决策一旦确定，后面的决策不会影响到之前决策的结果；（2）当前决策得到一个最优值，这个最优值怎么来的，后面的决策并不关心。

以下是解题步骤。

第 1 步：状态定义

比较容易想到的是：先阶段，即第几天，然后是状态 1，即处在第几个交易，再是状态 2，即现在是持股还是不持股。

设置持股的状态值为 1，不持股的时候，状态值为 0。

为此设计状态如下：

dp[i][j][K] ：表示到第 i 天为止，已经交易了 j 次，并且当前持股状态为 K 的最大收益。

说明：

到第 i 天为止（从 0 开始计算，到 len - 1 ），考虑的区间是 [0, i]，这里 len 为数组 prices 的长度；
已经交易了 j 次，j 从 0 开始计算，到 k - 1 为止；
持股状态 K （大写）只有 2 个值：0 和 1 。0 表示不持股，1 表示持股，为了与 k 区分，因此使用 K（大写）。

第 2 步：状态转移方程

下面考虑 dp[i][j][0] 和 dp[i][j][1] 可以怎样转移过来。

动态规划用于解决多阶段的决策问题，这里的阶段就是每一天，因此，状态都是从前一天的某一个之前的状态转移过来。

dp[i][j][0]：表示这一天发生了第 j 次交易（从 0 开始），并且不持股。

我是这样定义交易行为的：发生交易的标志是在某一天有了一次购买股票的行为，视为发生一次交易。发生一次抛售股票的行为，认为和上一次购买股票在一次交易行为内。

分类讨论的依据是：昨天是否持股。
（1）昨天不持股，今天还不持股，说明没有发生新的交易；
（2）昨天持股，今天不持股，说明这次交易结束了。这两种情况都在一次交易里。

二者取最大值，即：

dp[i][j][0] = max(dp[i - 1][j][0], dp[i - 1][j][1] + prices[i])

注意：中间的那个表示交易次数的状态都是 j。

dp[i][j][1]：表示这一天发生了第 j 次交易（从 0 开始），并且持股。

分类讨论的依据依然是：昨天是否持股。

（1）昨天持股，今天还持股，说明没有发生新的交易，这两天在同一个交易区间里；
（2）昨天不持股，今天持股，说明开启了一次新的交易。

二者取最大值，即：

dp[i][j][1] = max(dp[i - 1][j][1], dp[i - 1][j - 1][0] - prices[i])

第 3 步：初始化

所有不持股的状态值初始化的时候为 0。所有持股的状态值都设置为一个很大的负数（至少应该是最大的股价的负数 - 1），表示未知。
这里 i 和 j 下标都有 -1 ，所以 i 和 j 可以多设置一行，以避免复杂的分类讨论。以下只展示不多设置一行的代码。多设置一行的代码留给读者完成。

第 4 步：输出

最后一个阶段的最后一个状态，且是不持股的那个状态，即 dp[len - 1][k - 1][0]（i 和 j 不多设置一行的时候）。

第 5 步：考虑状态压缩

注意到两个状态转移方程，当前行只依赖上一行，可以考虑使用“滚动数组”这个技巧。但是注意到：j 只依赖 j - 1，但是是另一张表的状态值，因此直接砍掉第一维即可。

先写出没有状态压缩的版本。

参考代码 1：

public class Solution {

    public int maxProfit(int k, int[] prices) {
        int len = prices.length;
        // 特判
        if (k == 0 || len < 2) {
            return 0;
        }
        if (k >= len / 2) {
            return greedy(prices, len);
        }

        // dp[i][j][K]：到下标为 i 的天数为止（从 0 开始），到下标为 j 的交易次数（从 0 开始）
        // 状态为 K 的最大利润，K = 0 表示不持股，K = 1 表示持股
        int[][][] dp = new int[len][k][2];

        // 初始化：把持股的部分都设置为一个较大的负值
        for (int i = 0; i < len; i++) {
            for (int j = 0; j < k; j++) {
                dp[i][j][1] = -9999;
            }
        }

        // 编写正确代码的方法：对两个"基本状态转移方程"当 i - 1 和 j - 1 分别越界的时候，做特殊判断，赋值为 0 即可
        for (int i = 0; i < len; i++) {
            for (int j = 0; j < k; j++) {
                if (i == 0) {
                    dp[i][j][1] = -prices[0];
                    dp[i][j][0] = 0;
                } else {
                    if (j == 0) {
                        dp[i][j][1] = Math.max(dp[i - 1][j][1], -prices[i]);
                    } else {
                        // 基本状态转移方程 1
                        dp[i][j][1] = Math.max(dp[i - 1][j][1], dp[i - 1][j - 1][0] - prices[i]);
                    }
                    // 基本状态转移方程 2
                    dp[i][j][0] = Math.max(dp[i - 1][j][0], dp[i - 1][j][1] + prices[i]);
                }
            }
        }
        // 说明：i、j 状态都是前缀性质的，只需返回最后一个状态
        return dp[len - 1][k - 1][0];
    }

    private int greedy(int[] prices, int len) {
        // 转换为股票系列的第 2 题，使用贪心算法完成，思路是只要有利润，就交易
        int res = 0;
        for (int i = 1; i < len; i++) {
            if (prices[i - 1] < prices[i]) {
                res += prices[i] - prices[i - 1];
            }
        }
        return res;
    }
}

说明：状态数组 i 和 j 的部分可以分别多设置一行，这样在代码中可以少掉一些判断，请读者实现一下，进行对比。

再写出状态压缩的版本。

参考代码 2：

public class Solution {

    public int maxProfit(int k, int[] prices) {
        int len = prices.length;
        if (k == 0 || len < 2) {
            return 0;
        }
        if (k >= len / 2) {
            return greedy(prices, len);
        }

        int[][] dp = new int[k][2];

        for (int j = 0; j < k; j++) {
            dp[j][1] = -9999;
        }

        for (int price : prices) {
            for (int j = 0; j < k ; j++) {
                if (j == 0) {
                    dp[j][1] = Math.max(dp[j][1], -price);
                } else {
                    // 基本状态转移方程 1
                    dp[j][1] = Math.max(dp[j][1], dp[j - 1][0] - price);
                }
                // 基本状态转移方程 2
                dp[j][0] = Math.max(dp[j][0], dp[j][1] + price);
            }
        }
        return dp[k - 1][0];
    }

    private int greedy(int[] prices, int len) {
        int res = 0;
        for (int i = 1; i < len; i++) {
            if (prices[i - 1] < prices[i]) {
                res += prices[i] - prices[i - 1];
            }
        }
        return res;
    }
}

说明：状态转移方程可以设置 k + 1 行，第一行全为 0，感兴趣的读者可以尝试一下。

下面是状态数组语义化的版本，与上面的代码没有本质差别，供读者比对。

参考代码 3：

import java.util.Arrays;

public class Solution {

    public int maxProfit(int k, int[] prices) {
        int len = prices.length;
        if (len < 2 || k == 0) {
            return 0;
        }
        if (k >= len / 2) {
            return greedy(prices, len);
        }

        // k 次持股分别的状态
        int[] stock = new int[k];
        Arrays.fill(stock, -9999);

        // k 次不持股（持有现金）分别的状态
        int[] cash = new int[k];

        for (int price : prices) {
            for (int j = 0; j < k; j++) {
                stock[j] = Math.max(stock[j], (j == 0 ? 0 : cash[j - 1]) - price);
                cash[j] = Math.max(cash[j], stock[j] + price);
            }
        }
        return cash[k - 1];
    }

    private int greedy(int[] prices, int len) {
        int maxProfit = 0;
        for (int i = 1; i < len; i++) {
            if (prices[i] > prices[i - 1]) {
                maxProfit += prices[i] - prices[i - 1];
            }
        }
        return maxProfit;
    }
}