关注公众号【算法码上来】,每日算法干货马上就来!
题目描述
给定一个正整数数组 A,如果 A 的某个子数组中不同整数的个数恰好为 K,则称 A 的这个连续、不一定独立的子数组为好子数组。
(例如,[1,2,3,1,2] 中有 3 个不同的整数:1,2,以及 3。)
返回 A 中好子数组的数目。
示例1
输入:
A = [1,2,1,2,3], K = 2
输出:
7
解释:
恰好由 2 个不同整数组成的子数组:
[1,2], [2,1], [1,2], [2,3], [1,2,1], [2,1,2], [1,2,1,2]
示例2
输入:
A = [1,2,1,3,4], K = 3
输出:
3
解释:
恰好由 3 个不同整数组成的子数组:
[1,2,1,3], [2,1,3], [1,3,4]
提示
- 1 <= A.length <= 20000
- 1 <= A[i] <= A.length
- 1 <= K <= A.length
题解
这题最暴力的方法就是用一个字典维护每个数出现的次数,然后遍历所有的区间,求出不同整数个数正好等于 K 的区间个数。
但是这种方法时间复杂度是 $O(n^2)$,一定会超时,所以考虑其他方法。
现在考虑右边界为 j 的情况,左边界 i 有什么规律呢?
我们可以证明,满足 [i, j] 正好包含 K 个不同整数的 i 的取值是一段连续的区间。
假设 [i, j]包含 K 个不同整数,同时 [i’, j] 也包含 K 个不同整数(i < i’),因为从 i 移动到 i’ 每个数的数量是非增的,所以这过程中没有增加新的数,也没有任何一个数的数量降到了0。
有了这个性质之后,对于任意的 j ,我们只需要求出左边界 i 的取值范围就行了。同样这里还是不能暴力求,不然就和一开始没区别了嘛。
既然这样,想想如果 j 的左边界 i 的范围得到了,这时候我们继续求 j + 1 的左边界范围,能不能利用一下之前得到的结果?而不用重新计算。
很容易发现,如果 j 右移了, i 的取值范围也会右移,因为 j 右移有两种结果:一是引入了新的数,二是某个存在的数的数量加 1 。
第一种情况对左边界没有任何影响,因为不同整数数量没有变化,还是 K 。第二种情况不同整数数量变成 K + 1 了,这时候左边界一定要右移,删掉点数,才可能使区间符合题意。
有了上述的性质之后就好做了,因为左边界的取值范围也是不断右移的,所以我们只需要维护两个指针 l 和 r 就行了,一个保存取值范围的最小值,一个保存最大值。然后每次对于一个 j ,符合题意的子区间数量就是 r - l + 1 。而 j 右移一个数之后, l 需要右移,直到 [l, j] 中正好有 K 个不同整数, r 也继续右移,直到[r + 1, j] 中正好有 K - 1 个不同整数。
因为 l 和 r 最多只会移动 n 次,而 j 也只移动了 n 次,所以总体时间复杂度降到了 $O(n)$ 。
代码
c++
class Solution {
public:
int subarraysWithKDistinct(vector<int>& A, int K) {
int n = A.size();
int cl[n+1], cr[n+1], l = 0, r = 0;
int res = 0, nl = 0, nr = 0;
memset(cl, 0, sizeof cl);
memset(cr, 0, sizeof cr);
for (int i = 0; i < n; ++i) {
if (cl[A[i]]++ == 0) nl++;
while (nl > K) {
if (--cl[A[l++]] == 0) nl--;
}
if (cr[A[i]]++ == 0) nr++;
while (nr >= K) {
if (--cr[A[r++]] == 0) nr--;
}
res += r - l;
}
return res;
}
};
python
class Solution:
def subarraysWithKDistinct(self, A: List[int], K: int) -> int:
n = len(A)
cl = [0] * (n+1)
cr = [0] * (n+1)
l = r = nl = nr = res = 0
for i in range(n):
if cl[A[i]] == 0:
nl += 1
cl[A[i]] += 1
while nl > K:
cl[A[l]] -= 1
if cl[A[l]] == 0:
nl -= 1
l += 1
if cr[A[i]] == 0:
nr += 1
cr[A[i]] += 1
while nr >= K:
cr[A[r]] -= 1
if cr[A[r]] == 0:
nr -= 1
r += 1
res += r - l
return res
后记
其实这题想起来可能好想,但是写起来容易写错,因为区间范围需要好好琢磨。这一类问题统称为“窗口滑动”问题,都是不特别难,想清楚了两个状态之间窗口如何滑动就行了。