窗口思想——双指针

双指针
1.启发：假设已经有了这个数组的任意两个元素之和的有序数组。那么利用二分查找法进行查找，但是排序需要平方时间
2.这个二分查找法启发我们，可以直接对两个数字的和进行一个有序的遍历
1）双指针如果取两个最小（和最小）
双指针如果取两个最大（和最大）
双指针如果取最小和最大（和居中）
对于平均查找时间来讲，居中的具有优势
2）证明双指针法为什么是有效的？
a.如果存在答案，那么0 <= i < j <=n-1，i, j都往中间走，趋势是对的
b.一个循环不变式：每次循环后i, j永远都是可能性取值的边界位置

证明：
初始化：初始化前，i, j 处于边界（处于边界的意思是：已经有效排除了所有该排除的可能性）

维持：（若某次操作前，i, j处于边界， 操作后，i, j还是处于边界）
  a) 若(i) + (j) > target
    那么增加i为i1，(i1) + (j) > (i) + (j) > target，也即 任意移动i，所得的和都比target要大，因此排除掉了(j)位置的所有可能性
    只能递减j 
  b) 若(i) + (j) < target
    同理，那么递减j为j1，(i) + (j1) < (i) + (j) < target，也即 任意移动j，所得的和都比target要小，因此排除掉了(i)位置的所有可能性
    只能递增i

（根据证明可知：这个其实本质上也符合贪心的性质，最后转化为了更小子数组的查找）

时间复杂度

空间复杂度

关键思路

在序列首尾定义指针p1, p2，如果和超过s，p2往中间移动，如果和小于s，p1往中间移动。

bool FindNumbersWithSum(int data[], int length, int sum, 
                        int* num1, int* num2)
{
    bool found = false;
    if(length < 1 || num1 == NULL || num2 == NULL)
        return found;

    int ahead = length - 1;
    int behind = 0;

    while(ahead > behind)
    {
        long long curSum = data[ahead] + data[behind];

        if(curSum == sum)
        {
            *num1 = data[behind];
            *num2 = data[ahead];
            found = true;
            break;
        }
        else if(curSum > sum)
            ahead --;
        else
            behind ++;
    }

    return found;
}

1-032 连续正数序列和

输入一个正数s，打印出所有和为s的连续正数序列（至少含有两个数）。例如15，1+2+3+4+5 = 4 + 5 + 6 = 7 + 8 = 15，所以结果打印出三个连续序列1-5, 4-6, 7-8.

数据结构

数组

算法

双指针贪心
1）双指针法为什么可以找到所有的情况

这里有一个循环不变式：
  small没加一个，表示small-1的所有可能性已经穷尽；并且也已经穷尽了big从small + 1到当前值的可能性

以target = 15为例说明：
step1. small = 1, big =2，将big一直向右移动，直至sum(small - big) = 15，记录下来；
           继续加到sum(small - big) = 21 > 15，此时small = 1, big = 6
           这是如果big继续加大，那么sum只会更大，偏离target更多，因此
           以small = 1起始的所有情况穷尽了
step2. 内部while循环 找到的是第一个sum > target的big值
           此时small = 1, big = 6，在前面一个的时候sum <= target
           因为此时small = 1已经穷尽，只能small ++变为2
           但是因为sum(2 - 5) < sum(1- 5)，因此只有可能sum(2 - 6)才可能等于target，这也是为什么内部循环要如此写的原因
step3.一直按照step1, step2这样循环往复地分析，就能获取到所有可能性（所有以某个数开始的连续和的所有可能性）

small >= middle
big > small >= midlle
sum(small - big) > target

时间复杂度

空间复杂度

关键思路

void PrintContinuousSequence(int small, int big);

void FindContinuousSequence(int sum)
{
    if(sum < 3)
        return;

    int small = 1; 
    int big = 2;
    int middle = (1 + sum) / 2;
    int curSum = small + big;

    while(small < middle)
    {
        if(curSum == sum)
            PrintContinuousSequence(small, big);

        while(curSum > sum && small < middle)
        {
            curSum -= small;
            small ++;

            if(curSum == sum)
                PrintContinuousSequence(small, big);
        }

        big ++;
        curSum += big;
    }
}

void PrintContinuousSequence(int small, int big)
{
    for(int i = small; i <= big; ++ i)
        printf("%d ", i);

    printf("\n");
}

1-033 leetcode-49. Group Anagrams

Given an array of strings, group anagrams together.

For example, given: ["eat", "tea", "tan", "ate", "nat", "bat"], 
Return:

[
  ["ate", "eat","tea"],
  ["nat","tan"],
  ["bat"]
]
Note: All inputs will be in lower-case.

数据结构

关联容器map

算法

哈希数组

时间复杂度

空间复杂度

关键思路

然利用dic[26]：先从头到尾扫一遍string，然后给dic对应位置+1，然后将dic元素本身的排列作为key。这样，
(1) 在有空格和标点的情况下，依然可以判断两个string是否是anagram，如果有大写字母或者数字，只需要扩张dic的大小即可；而且Key的长度为定值，这里总是26。
(2) 不再需要O(mlogm)的时间复杂度，需要O(m+26) = O(m)的复杂度。

class Solution {
public:
    vector<string> anagrams(vector<string> &strs) {
        vector<string> res;
        if(strs.size() == 0) return res;
        map<string, int> rec; 
        dic = new int[26];
        for(int i = 0; i < strs.size(); ++i){
            string key = generateKeyByDic(dic, 26, strs[i]);
            if(rec.find(key) == rec.end()){
                rec.insert(make_pair(key, i));
            }else{
                if(rec[key] >= 0){
                    res.push_back(strs[rec[key]]);
                    rec[key] = -1;
                }
                res.push_back(strs[i]);
            }
        }
        return res;
    }
private:
    int* dic;
    string generateKeyByDic(int* dic, int n, string str){
        for(int i = 0; i < n; ++i){
            dic[i] = 0;
        }
        for(int j = 0; j < str.length(); ++j){
            if(str[j] <= 'z' && str[j] >= 'a')
                dic[str[j] - 'a']++;
        }
        string key(26, '0');
        for(int k = 0; k < 26; ++k){
            key[k] = dic[k] + '0';
        }
        return key;
    }
};

1-034 leetcode-3. Longest Substring Without Reapting Characters

Given a string, find the length of the longest substring without repeating characters.

Examples:

Given "abcabcbb", the answer is "abc", which the length is 3.

Given "bbbbb", the answer is "b", with the length of 1.

Given "pwwkew", the answer is "wke", with the length of 3. Note that the answer must be a substring, "pwke" is a subsequence and not a substring.

数据结构

关联容器map

算法

双指针窗口
1）为什么start和end这种移动方式就能找到所有无重复的字符串

循环不变式：一直求得是以start开头的最长无重复字符串

说明：以abcdcbaefga为例
step1. start = 0
    end一直累加，直到end指向4
    这是以0开头的最长的无重复字符串
step2. 当end = 4时，因为此时start = 0，因为start - end之间含有两个c
    因此，移动start = 1，此时还是有两个c，因此 此时的end - start无疑较小，继续累加，这是以1开头的最长无重复
    start =2 ，此时还有两个c，继续累加，这是以2开头的最长无重复字符串
    start = 3，无重复，此时需要累加end，以求得以3开头的最长无重复字符串

时间复杂度

空间复杂度

关键思路

使用窗口的思想，定义start，end作为窗口的两端，开始时start = end = 0；再定义一个Map，用来检测窗口中是否有重复字符。

class Solution {
public:
    int lengthOfLongestSubstring(string s) {
        int len = s.length();
        if(len == 0) return 0;
        int start = 0, end = 0, max = 0;
        int* map = new int[256]; //自定义Map
        for(int i = 0; i < 256; ++i) map[i] = 0;
        while(end < len){
            if(map[s[end] - '\0'] == 0){
                map[s[end] - '\0']++; //右移end扩大窗口
                if((end - start + 1) > max) max = (end - start + 1);
                ++end;
            }else{
                for(; map[s[end] - '\0'] > 0; map[s[start] - '\0']--, ++start); //右移start缩小窗口
            }
        }
        return max;
    }
};

另一种本质相同的解法：

int lengthOfLongestSubstring(string s) {
        vector<int> map(128,0);
        int counter=0, begin=0, end=0, d=0; 
        while(end<s.size()){
            if(map[s[end++]]++>0) counter++; 
            while(counter>0) if(map[s[begin++]]-->1) counter--;
            d=max(d, end-begin); //while valid, update d
        }
        return d;
    }

说明：
   counter标记是否有重复
   map标记是哪个字符重复，重复的字符>1

1-005 leetcode-76.Minimum Window Substring

Given a string S and a string T, find the minimum window in S which will contain all the characters in T in complexity O(n).

For example,
S = "ADOBECODEBANC"
T = "ABC"
Minimum window is "BANC".

Note:
If there is no such window in S that covers all characters in T, return the empty string "".

If there are multiple such windows, you are guaranteed that there will always be only one unique minimum window in S.

数据结构

对于单个字符map/hash

算法

我们可以发现窗口思想应用场景的一些特点：一般都是要求一个子串或者子数组整体满足一定条件，比如要和最大，要包含什么字符之类的；而且所求的结果肯定和这个子串或者子数组长度有关。
1）证明为什么如此做是正确的？

a. 证明为空的情况
        for(i = 0; i < S.length(); ++i){
            if(chT[S[i] - '\0'] > 0 && chS[S[i] - '\0'] < chT[S[i] - '\0']) {
              ++cntS; 
             }
            ++chS[S[i] - '\0'];
            if(cntS == cntT) break;
        }
  其中 chT[S[i] - '\0'] > 0 表示S中的该字符在T中存在，chS[S[i] - '\0'] < chT[S[i] - '\0']控制的是该字符的个数；该循环的目的是累计到目前为止i，S中出现的T中的字符的个数cntS。
  如果cntS等于cntT，表示找到第一个T中所有字符。
  若没有找到，i等于S.length()

b. 证明第一个for循环不变式：保持的是st和end之间始终包含字符串T
    因为这个循环终止的条件为chT[S[st-1] - '\0'] > 0 && chS[S[st-1] - '\0'] < chT[S[st-1] - '\0']
    这个表示刚刚去掉的一个字符st-1为T中的字符，且此时S中st - end到字符统计chS出现了空缺，导致S[st-1]字符比T中少。
    这里有两个统计量：chT和chS

c. 证明第二个for循环不变式：保持的是st和end之间之中缺少字符toFind
    到了第二个for循环，前提是st和end之间之中缺少字符toFind
    但是这个for循环退出的条件是toFind等于S[end]，得证

d. 证明算法能够找到最小的窗口
    step0.以start=0开始的最小的包含T的窗口是：end一直累加到首次完整包含T;
              若后面end继续增加，则窗口大小都要增大
    step1.start一直增大，直到首次不包含完整T的前一个字符st
              start = 1 - st，这些都是以1 - st等字符为首的包含T的最小窗口
    step2. start = st + 1表示首次不包含完整T的起始字符，此时end一直累加到以st + 1开始的首次完整包含T
              重复step0. step1.即可穷尽所有可能性

时间复杂度

空间复杂度

关键思路

先不断向右移动end直到当前窗口已经包含T中所有字符，然后向右移动start 直到再移动start的话窗口就不再包含T所有字符了，这个时候记录下窗口大小(end - start) 并和 min 比较即可。最后返回min。

class Solution {
public:
    string minWindow(string S, string T) {
        if(T.length() == 0 || S.length() == 0) return "";
        int chT[256];
        int chS[256];
        int i, j, k, cntT = T.length(), cntS = 0;
        for(i = 0; i < 256; chT[i] = 0, chS[i] = 0, ++i);
        for(i = 0; i < T.length(); ++chT[T[i] - '\0'], ++i);
        for(i = 0; i < S.length(); ++i){
            if(chT[S[i] - '\0'] > 0 && chS[S[i] - '\0'] < chT[S[i] - '\0']) ++cntS;
            ++chS[S[i] - '\0'];
            if(cntS == cntT) break;
        }
        if(i == S.length()) return ""; //至此，找到了第一个包含T中所有charactor的S 字串
        int end = i, st = 0; char toFind; //st指针右移，直到窗口因为缺少T中某个charactor(把这个ch记为toFind)而不再满足要求，就开始右移end指针，直到又找到了toFind
        int minlen = end - st + 1, minst = st;
        while(end < S.length()){
           for(++st; st <= end; ++st){
                --chS[S[st-1] - '\0'];
                if(chT[S[st-1] - '\0'] > 0 && chS[S[st-1] - '\0'] < chT[S[st-1] - '\0']){ 
                    toFind = S[st-1]; break;}
                else if((end - st + 1) < minlen){
                    minlen = (end - st + 1);
                    minst = st;
                }
            }
            for(++end; end < S.length(); ++end){
                ++chS[S[end] - '\0'];
                if(toFind == S[end]) break;
            }
        }
        return S.substr(minst, minlen);
    }
};

本质上相同的解法：

string minWindow(string s, string t) {
        vector<int> map(128,0);
        for(auto c: t) map[c]++;
        int counter=t.size(), begin=0, end=0, d=INT_MAX, head=0;
        while(end<s.size()){
            if(map[s[end++]]-->0) counter--; //in t
            while(counter==0){ //valid
                if(end-begin<d)  d=end-(head=begin);
                if(map[s[begin++]]++==0) counter++;  //make it invalid
            }  
        }
        return d==INT_MAX? "":s.substr(head, d);
    }

正确性证明：
1）对于s中不属于t的字符，是否会干扰？
    对于不属于t的字符，初始化时，map[c] = 0
    在循环里面：
         第一个if语句的地方，由于之前初始化时是0，所以此时不影响counter计数
         在内存while语句里面，由于if语句进行了--，begin（重走end老路，end已经--过了）小于0，所有也不会影响counter
    这里的关键是：
        a.初始化为0
        b.end处理还未处理的字符，并且--，end处理过后，为负数
        c.begin重走end的老路，++，所以begin走后最高只会为0

2）对于s中属于t的字符，是否正确处理了？
    a. if(map[s[end++]]-->0)，这个>0不能少，控制的是该字符的个数
    b.counter为0时，表示begin-end之间已经包含了t
        此时map中对应的t字符全为0，s中不属于t的字符全为负数
    c.此时增加begin，直到刚好不包含t为止

总结，这个map的含义：要在s中查找的字符c的个数，如果查到了，就减一。

1-035 leetcode-30. Substring with Concatenation of All Words

You are given a string, s, and a list of words, words, that are all of the same length. Find all starting indices of substring(s) in s that is a concatenation of each word in words exactly once and without any intervening characters.

For example, given:
s: "barfoothefoobarman"
words: ["foo", "bar"]

You should return the indices: [0,9].
(order does not matter).

数据结构

算法

双指针窗口

说明：
1）因为是定长，所以所有可能性不外乎遍历（0...seg）为起始位置，检查长度为seg的情况
2）map表示在S中需要找到的，如果map[str] == 0，表示S中已经找到了所有的这些str
3）st -= dist
      map[S.substr(st.seg)]++;
      --count;
      st += dist;
      表示其实位置向后移动一位，因为map只是去掉了一个str，下一个循环st又加了一个seg，正好检查下一个位置。

时间复杂度

空间复杂度

关键思路

这时候我们引入窗口的思想。假设窗口的起始状态是"bar"，然后end右移unit位，如果新被窗口包含进来的部分属于L，而且正好窗口大小和L大小相同了，那么当前start的值被记录要返回的vector中。若新被窗口包含进来的部分根本不属于L，那么start就可以直接移到end了，end则赋值为start+unit。若新被窗口包含进来的部分属于L，但是不巧，窗口中已有的部分已经把L这种字符串占满了，那么start就要右移了，一直移到这种字符串有一个不再被包含在窗口中。

不要忘了，这种窗口的思想，start和end的步长都是unit。所以，为了保证所有的正解都能被包含到。我们需要定义Unit个窗口，每一个窗口的start开始位置分别从0到unit。

class Solution {
public:
    vector<int> findSubstring(string S, vector<string> &L) {
        vector<int> res;
        if(L.size() == 0) return res;
        if(S.length() == 0) return res;
        int seg = L[0].length();
        if(seg > S.length() || seg == 0) return res;
        int st = 0, count = 0, i = 0, j = 0;
        map<string, int> map;
        string str;
        for(i = 0; i < seg; ++i){
            map.clear();
            count = 0;
            for(vector<string>::iterator it = L.begin(); it != L.end(); ++map[*it], ++it);
            for(st = i; st < S.length(); st += seg){
                str = S.substr(st, seg);
                if(map.find(str) != map.end() && map[str] > 0){
                    map[str]--;
                    ++count;
                    if(count == L.size()){  //找到一个结果
                        st -= ((count-1) * seg);
                        res.push_back(st);
                        map[S.substr(st, seg)]++;   //把符合条件的子序列中最前端的unit移除
                        st += ((count-1) * seg);
                        --count;
                    }
                }else if(count > 0){    //虽然当前不匹配，但只要之前还有成功匹配的部，都要考虑以之前的匹配部分为起点，挨个尝试。
                    st -= (count * seg);
                    map[S.substr(st, seg)]++;
                    --count;
                    st += (count * seg);
                }
            }
        }
        return res;
    }
};

最后编辑于：2017.12.14 14:47:40

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 219,869评论 6赞 508
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,716评论 3赞 396
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 166,223评论 0赞 357
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 59,047评论 1赞 295
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 68,089评论 6赞 395
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,839评论 1赞 308
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,516评论 3赞 420
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,410评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,920评论 1赞 319
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 38,052评论 3赞 340
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 40,179评论 1赞 352
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,868评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,522评论 3赞 331
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 32,070评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,186评论 1赞 272
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,487评论 3赞 375
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 45,162评论 2赞 356

窗口思想——双指针

窗口思想——双指针

目录

1-031 两个数和

数据结构

算法

时间复杂度

空间复杂度

关键思路

1-032 连续正数序列和

数据结构

算法

时间复杂度

空间复杂度

关键思路

1-033 leetcode-49. Group Anagrams

数据结构

算法

时间复杂度

空间复杂度

关键思路

1-034 leetcode-3. Longest Substring Without Reapting Characters

数据结构

算法

时间复杂度

空间复杂度

关键思路

1-005 leetcode-76.Minimum Window Substring

数据结构

算法

时间复杂度

空间复杂度

关键思路

1-035 leetcode-30. Substring with Concatenation of All Words

数据结构

算法

时间复杂度

空间复杂度

关键思路

推荐阅读更多精彩内容