「力扣」第 188 题:买卖股票的最佳时机 IV
给定一个数组,它的第
i
个元素是一支给定的股票在第i
天的价格。设计一个算法来计算你所能获取的最大利润。你最多可以完成
k
笔交易。注意: 你不能同时参与多笔交易(你必须在再次购买前出售掉之前的股票)。
示例 1:
输入: [2, 4, 1], k = 2 输出: 2 解释: 在第 1 天 (股票价格 = 2) 的时候买入,在第 2 天 (股票价格 = 4) 的时候卖出,这笔交易所能获得利润 = 4-2 = 2 。
示例 2:
输入: [3, 2, 6, 5, 0, 3], k = 2 输出: 7 解释: 在第 2 天 (股票价格 = 2) 的时候买入,在第 3 天 (股票价格 = 6) 的时候卖出, 这笔交易所能获得利润 = 6-2 = 4 。 随后,在第 5 天 (股票价格 = 0) 的时候买入,在第 6 天 (股票价格 = 3) 的时候卖出, 这笔交易所能获得利润 = 3-0 = 3 。
首先需要判断的一点是,一次交易至少需要 2 天,一天买,一天卖。因此如果 k
很大,大到大于等于 len / 2
,就相当于股票系列的第 2 题,使用贪心算法去做就可以了。这是一个特判。
这道题用动态规划完成,比之前的股票问题多一个限制,则有后效性,因此可以多设置一个状态去消除这种后效性。
“无后效性”有两层含义:(1)当前做的决策一旦确定,后面的决策不会影响到之前决策的结果;(2)当前决策得到一个最优值,这个最优值怎么来的,后面的决策并不关心。
以下是解题步骤。
第 1 步:状态定义
比较容易想到的是:先阶段,即第几天,然后是状态 1,即处在第几个交易,再是状态 2,即现在是持股还是不持股。
设置持股的状态值为 1,不持股的时候,状态值为 0。
为此设计状态如下:
dp[i][j][K]
:表示到第 i
天为止,已经交易了 j
次,并且当前持股状态为 K
的最大收益。
说明:
- 到第
i
天为止(从0
开始计算,到len - 1
),考虑的区间是[0, i]
,这里len
为数组prices
的长度; - 已经交易了
j
次,j
从0
开始计算,到k - 1
为止; - 持股状态
K
(大写)只有 2 个值:0
和1
。0
表示不持股,1
表示持股,为了与k
区分,因此使用K
(大写)。
第 2 步:状态转移方程
下面考虑 dp[i][j][0]
和 dp[i][j][1]
可以怎样转移过来。
动态规划用于解决多阶段的决策问题,这里的阶段就是每一天,因此,状态都是从前一天的某一个之前的状态转移过来。
dp[i][j][0]
:表示这一天发生了第j
次交易(从0
开始),并且不持股。
我是这样定义交易行为的:发生交易的标志是在某一天有了一次购买股票的行为,视为发生一次交易。发生一次抛售股票的行为,认为和上一次购买股票在一次交易行为内。
分类讨论的依据是:昨天是否持股。
(1)昨天不持股,今天还不持股,说明没有发生新的交易;
(2)昨天持股,今天不持股,说明这次交易结束了。这两种情况都在一次交易里。
二者取最大值,即:
dp[i][j][0] = max(dp[i - 1][j][0], dp[i - 1][j][1] + prices[i])
注意:中间的那个表示交易次数的状态都是 j
。
dp[i][j][1]
:表示这一天发生了第j
次交易(从0
开始),并且持股。
分类讨论的依据依然是:昨天是否持股。
(1)昨天持股,今天还持股,说明没有发生新的交易,这两天在同一个交易区间里;
(2)昨天不持股,今天持股,说明开启了一次新的交易。
二者取最大值,即:
dp[i][j][1] = max(dp[i - 1][j][1], dp[i - 1][j - 1][0] - prices[i])
第 3 步: 初始化
- 所有不持股的状态值初始化的时候为
0
。所有持股的状态值都设置为一个很大的负数(至少应该是最大的股价的负数 - 1),表示未知。 - 这里
i
和j
下标都有-1
,所以i
和j
可以多设置一行,以避免复杂的分类讨论。以下只展示不多设置一行的代码。多设置一行的代码留给读者完成。
第 4 步:输出
最后一个阶段的最后一个状态,且是不持股的那个状态,即 dp[len - 1][k - 1][0]
(i
和 j
不多设置一行的时候)。
第 5 步:考虑状态压缩
注意到两个状态转移方程,当前行只依赖上一行,可以考虑使用“滚动数组”这个技巧。但是注意到:j
只依赖 j - 1
,但是是另一张表的状态值,因此直接砍掉第一维即可。
先写出没有状态压缩的版本。
参考代码 1:
public class Solution {
public int maxProfit(int k, int[] prices) {
int len = prices.length;
// 特判
if (k == 0 || len < 2) {
return 0;
}
if (k >= len / 2) {
return greedy(prices, len);
}
// dp[i][j][K]:到下标为 i 的天数为止(从 0 开始),到下标为 j 的交易次数(从 0 开始)
// 状态为 K 的最大利润,K = 0 表示不持股,K = 1 表示持股
int[][][] dp = new int[len][k][2];
// 初始化:把持股的部分都设置为一个较大的负值
for (int i = 0; i < len; i++) {
for (int j = 0; j < k; j++) {
dp[i][j][1] = -9999;
}
}
// 编写正确代码的方法:对两个"基本状态转移方程"当 i - 1 和 j - 1 分别越界的时候,做特殊判断,赋值为 0 即可
for (int i = 0; i < len; i++) {
for (int j = 0; j < k; j++) {
if (i == 0) {
dp[i][j][1] = -prices[0];
dp[i][j][0] = 0;
} else {
if (j == 0) {
dp[i][j][1] = Math.max(dp[i - 1][j][1], -prices[i]);
} else {
// 基本状态转移方程 1
dp[i][j][1] = Math.max(dp[i - 1][j][1], dp[i - 1][j - 1][0] - prices[i]);
}
// 基本状态转移方程 2
dp[i][j][0] = Math.max(dp[i - 1][j][0], dp[i - 1][j][1] + prices[i]);
}
}
}
// 说明:i、j 状态都是前缀性质的,只需返回最后一个状态
return dp[len - 1][k - 1][0];
}
private int greedy(int[] prices, int len) {
// 转换为股票系列的第 2 题,使用贪心算法完成,思路是只要有利润,就交易
int res = 0;
for (int i = 1; i < len; i++) {
if (prices[i - 1] < prices[i]) {
res += prices[i] - prices[i - 1];
}
}
return res;
}
}
说明:状态数组 i
和 j
的部分可以分别多设置一行,这样在代码中可以少掉一些判断,请读者实现一下,进行对比。
再写出状态压缩的版本。
参考代码 2:
public class Solution {
public int maxProfit(int k, int[] prices) {
int len = prices.length;
if (k == 0 || len < 2) {
return 0;
}
if (k >= len / 2) {
return greedy(prices, len);
}
int[][] dp = new int[k][2];
for (int j = 0; j < k; j++) {
dp[j][1] = -9999;
}
for (int price : prices) {
for (int j = 0; j < k ; j++) {
if (j == 0) {
dp[j][1] = Math.max(dp[j][1], -price);
} else {
// 基本状态转移方程 1
dp[j][1] = Math.max(dp[j][1], dp[j - 1][0] - price);
}
// 基本状态转移方程 2
dp[j][0] = Math.max(dp[j][0], dp[j][1] + price);
}
}
return dp[k - 1][0];
}
private int greedy(int[] prices, int len) {
int res = 0;
for (int i = 1; i < len; i++) {
if (prices[i - 1] < prices[i]) {
res += prices[i] - prices[i - 1];
}
}
return res;
}
}
说明:状态转移方程可以设置 k + 1
行,第一行全为 0
,感兴趣的读者可以尝试一下。
下面是状态数组语义化的版本,与上面的代码没有本质差别,供读者比对。
参考代码 3:
import java.util.Arrays;
public class Solution {
public int maxProfit(int k, int[] prices) {
int len = prices.length;
if (len < 2 || k == 0) {
return 0;
}
if (k >= len / 2) {
return greedy(prices, len);
}
// k 次持股分别的状态
int[] stock = new int[k];
Arrays.fill(stock, -9999);
// k 次不持股(持有现金)分别的状态
int[] cash = new int[k];
for (int price : prices) {
for (int j = 0; j < k; j++) {
stock[j] = Math.max(stock[j], (j == 0 ? 0 : cash[j - 1]) - price);
cash[j] = Math.max(cash[j], stock[j] + price);
}
}
return cash[k - 1];
}
private int greedy(int[] prices, int len) {
int maxProfit = 0;
for (int i = 1; i < len; i++) {
if (prices[i] > prices[i - 1]) {
maxProfit += prices[i] - prices[i - 1];
}
}
return maxProfit;
}
}