1.原题
Given a string, find the length of the longest substring without repeating characters.
Examples:
Given "abcabcbb", the answer is "abc", which the length is 3.
Given "bbbbb", the answer is "b", with the length of 1.
Given "pwwkew", the answer is "wke", with the length of 3. Note that the answer must be a substring, "pwke" is a subsequence and not a substring.
2.题意
给定一个字符串,找出其最大的子串,子串不包含重复字符。
3.思路
- 首先,什么是子字符串,什么是子序列,子串代表的是原字符串中连续的字符,而子序列代表的是子序列不需要是挨着的,只要是在原字符串中也是这样的先后顺序。举个例子,比如pwwkew,wke是子串,而pwke只是子序列
- 其次,题目的一个重要的要求是,子串中不能有重复元素
- 做法是,我们从第一个元素开始往后扫描,一边扫描,一边保存一个hash表,这个表记录的是截止到当前的字符在原字符串中的位置(下标)。
- 当我们扫描到某个字符,发现该字符在上一个子串中已经存在了,我们更新hash表中该字符的下标,并查看当前的子字符串是不是长度当前最大。
- 举例,比如对于pwwkew,
- 扫描p记录p对应的下标p->0,
- 扫描w同样记录w->1,
- 继续扫描时发现w已经在上一个字符串中出现了,那么上一个字符串的长度就是2,更新下当前最大的子串长度到2.
- 这个时候开启了新的子串,
- w的下标是w->2,
- 然后扫描k:k->3,
- 继续,e->4,
- 接下来又扫描发现了w,这个时候上一个子串到头了,子串是wke,长度是3.更新当前最大的子串长度是3.
4.代码如下
JAVA
class Solution {
public int lengthOfLongestSubstring(String s) {
int begin_index = 0;
int max = 0;
int[] mark = new int[256];
Arrays.fill(mark, -1);
for(int i = 0; i < s.length(); i++) {
int index = s.charAt(i);
if(mark[index] != -1 && mark[index] >= begin_index) {
max = max > (i - begin_index)?max: i - begin_index;
begin_index = mark[index] + 1;
}
mark[index] = i;
}
max = max > (s.length() - begin_index)?max: s.length() - begin_index;
return max;
}
}
Python
class Solution:
def lengthOfLongestSubstring(self, s):
"""
:type s: str
:rtype: int
"""
hash_table = []
for i in range(256):
hash_table.append(-1)
max_res = 0
begin_index = 0
for i in range(len(s)):
if hash_table[ord(s[i])] != -1 and hash_table[ord(s[i])] >= begin_index:
max_res = max(max_res, i - begin_index)
begin_index = hash_table[ord(s[i])] + 1
hash_table[ord(s[i])] = i
max_res = max(max_res, len(s) - begin_index)
return max_res