最长回文子串

转载:https://segmentfault.com/a/1190000003914228

0. 问题定义

最长回文子串问题:给定一个字符串,求它的最长回文子串长度。

如果一个字符串正着读和反着读是一样的,那它就是回文串。下面是一些回文串的实例:

12321 a aba abba aaaa tattarrattat(牛津英语词典中最长的回文单词)

1. Brute-force 解法

对于最长回文子串问题,最简单粗暴的办法是:找到字符串的所有子串,遍历每一个子串以验证它们是否为回文串。一个子串由子串的起点和终点确定,因此对于一个长度为n的字符串,共有n2个子串。这些子串的平均长度大约是n/2,因此这个解法的时间复杂度是O(n3)。

2. 改进的方法

显然所有的回文串都是对称的。长度为奇数回文串以最中间字符的位置为对称轴左右对称,而长度为偶数的回文串的对称轴在中间两个字符之间的空隙。可否利用这种对称性来提高算法效率呢?答案是肯定的。我们知道整个字符串中的所有字符,以及字符间的空隙,都可能是某个回文子串的对称轴位置。可以遍历这些位置,在每个位置上同时向左和向右扩展,直到左右两边的字符不同,或者达到边界。对于一个长度为n的字符串,这样的位置一共有n+n-1=2n-1个,在每个位置上平均大约要进行n/4次字符比较,于是此算法的时间复杂度是O(n^2)。

3. Manacher 算法

对于一个比较长的字符串,O(n^2)的时间复杂度是难以接受的。Can we do better?

先来看看解法2存在的缺陷。

  1. 由于回文串长度的奇偶性造成了不同性质的对称轴位置,解法2要对两种情况分别处理;
  2. 很多子串被重复多次访问,造成较差的时间效率。

缺陷2)可以通过这个直观的小?体现:

char: a b a b a
  i : 0 1 2 3 4

当i==1,和i==2时,左边的子串aba分别被遍历了一次。

如果我们能改善解法2的不足,就很有希望能提高算法的效率。Manacher正是针对这些问题改进算法。

(1) 解决长度奇偶性带来的对称轴位置问题

Manacher算法首先对字符串做一个预处理,在所有的空隙位置(包括首尾)插入同样的符号,要求这个符号是不会在原串中出现的。这样会使得所有的串都是奇数长度的。以插入#号为例:

aba  ———>  #a#b#a#
abba ———>  #a#b#b#a#

插入的是同样的符号,且符号不存在于原串,因此子串的回文性不受影响,原来是回文的串,插完之后还是回文的,原来不是回文的,依然不会是回文。

(2) 解决重复访问的问题

我们把一个回文串中最左或最右位置的字符与其对称轴的距离称为回文半径。Manacher定义了一个回文半径数组RL,用RL[i]表示以第i个字符为对称轴的回文串的回文半径。我们一般对字符串从左往右处理,因此这里定义RL[i]为第i个字符为对称轴的回文串的最右一个字符与字符i的距离。对于上面插入分隔符之后的两个串,可以得到RL数组:

char:    # a # b # a #
 RL :    1 2 1 4 1 2 1
RL-1:    0 1 0 3 0 1 0
  i :    0 1 2 3 4 5 6

char:    # a # b # b # a #
 RL :    1 2 1 2 5 2 1 2 1
RL-1:    0 1 0 1 4 1 0 1 0
  i :    0 1 2 3 4 5 6 7 8

上面我们还求了一下RL[i]-1。通过观察可以发现,RL[i]-1的值,正是在原本那个没有插入过分隔符的串中,以位置i为对称轴的最长回文串的长度。那么只要我们求出了RL数组,就能得到最长回文子串的长度。

于是问题变成了,怎样高效地求的RL数组。基本思路是利用回文串的对称性,扩展回文串

我们再引入一个辅助变量MaxRight,表示当前访问到的所有回文子串,所能触及的最右一个字符的位置。另外还要记录下MaxRight对应的回文串的对称轴所在的位置,记为pos,它们的位置关系如下。

[图片上传失败...(image-8caaf9-1525833853509)]

我们从左往右地访问字符串来求RL,假设当前访问到的位置为i,即要求RL[i],在对应上图,i必然是在po右边的(obviously)。但我们更关注的是,i是在MaxRight的左边还是右边。我们分情况来讨论。

1)当iMaxRight的左边

情况1)可以用下图来刻画:

[图片上传失败...(image-1bdb7c-1525833853509)]

我们知道,图中两个红色块之间(包括红色块)的串是回文的;并且以i为对称轴的回文串,是与红色块间的回文串有所重叠的。我们找到i关于pos的对称位置j,这个j对应的RL[j]我们是已经算过的。根据回文串的对称性,以i为对称轴的回文串和以j为对称轴的回文串,有一部分是相同的。这里又有两种细分的情况。

  1. j为对称轴的回文串比较短,短到像下图这样。

[图片上传失败...(image-be0cda-1525833853509)]

这时我们知道RL[i]至少不会小于RL[j],并且已经知道了部分的以i为中心的回文串,于是可以令RL[i]=RL[j]。但是以i为对称轴的回文串可能实际上更长,因此我们试着以i为对称轴,继续往左右两边扩展,直到左右两边字符不同,或者到达边界。

  1. j为对称轴的回文串很长,这么长:

[图片上传失败...(image-a46b8c-1525833853509)]

这时,我们只能确定,两条蓝线之间的部分(即不超过MaxRight的部分)是回文的,于是从这个长度开始,尝试以i为中心向左右两边扩展,,直到左右两边字符不同,或者到达边界。

不论以上哪种情况,之后都要尝试更新MaxRightpos,因为有可能得到更大的MaxRight。

具体操作如下:

step 1: 令RL[i]=min(RL[2*pos-i], MaxRight-i)
step 2: 以i为中心扩展回文串,直到左右两边字符不同,或者到达边界。
step 3: 更新MaxRight和pos

2)当iMaxRight的右边

[图片上传失败...(image-be0815-1525833853509)]

遇到这种情况,说明以i为对称轴的回文串还没有任何一个部分被访问过,于是只能从i的左右两边开始尝试扩展了,当左右两边字符不同,或者到达字符串边界时停止。然后更新MaxRightpos

思考:为什么辅助变量要选择记录“当前访问到的所有回文子串所能触及的最右一个字符的位置”,而不是诸如“当前访问到最长回文子串”。

这样能够凭借已经遍历的经验,找到以i为对称轴的较长子串,子串长度以 maxRight 为界。也就是说,能凭借经验得到的子串长度为 (maxRight-pos)*2+1,当然 maxRight 越大直接得出的子串越长,就越省事啦。

(3) 算法实现

//代码一:leetcode 时间较短的方案
class Solution {
    private int start = 0;
    private int maxLength = 1;
    public String longestPalindrome(String s){
        if (s.length() < 2)
            return s;

        for (int i = 0; i < s.length(); i++){
            getMaxLength(s, i, i);
            getMaxLength(s, i, i+1);
        }
        return s.substring(start, start+maxLength);
    }

    private void getMaxLength(String s, int i, int j){
        while (i >= 0 && j < s.length() && s.charAt(i) == s.charAt(j)){
            if (maxLength < (j-i+1)){
                maxLength = j-i+1;
                start = i;
            }
            i--;
            j++;
        }
    }
}
//代码二:我的解法
    /**
     * @Title: 最长回文子串
     * @Description: 给定一个字符串s,找到s中最长的回文子串。你可以假设s的最大长度为1000。
     */
    public String longestPalindrome(String s) {

        //字符数组预处理,转换偶数长度的回文子串
        //如 abdcccs 转换成 #a#b#d#c#c#c#s#
        char[] chars = pretreatmentPalindrome(s.toCharArray());

        //当前访问到的所有回文子串,所能触及的最右一个字符的位置
        int maxRight=0;
        //maxRight对应对称轴
        int pos=0;

        //记录每个元素为对称轴回文子串的长度
        int[] RL = new int[chars.length];

        //遍历
        for (int i=0;i<chars.length;i++){
            int right;
            if (i<maxRight){
                //i关于pos的对称位置:2*pos-i
                //可以凭经验获取的以i为对称轴的最长回文子串:(maxRight-pos)*2+1
                if(RL[2*pos-i]<(maxRight-pos)*2+1){
                    right = i+ RL[2*pos-i]/2+1;
                }else{
                    right = maxRight+1;
                }
            }else{
                right = i+1;
            }
            while(((2*i-right)>=0)&&right<chars.length&&chars[right]==chars[2*i-right]){
                right++;
            }
            right--;
            RL[i]=(right-i)*2+1;
            if(right>maxRight){
                maxRight = right;
                pos = i;
            }
        }

        return extractPalinadrome(RL,chars);
    }

    private String extractPalinadrome(int[] RL,char[] chars){
        int maxLength=0;
        int maxPos=0;
        for (int i=0;i<chars.length;i++){
            if(RL[i]>maxLength){
                maxLength=RL[i];
                maxPos=i;
            }
        }

        char[] tempChars = new char[maxLength/2];
        int index=0;
        for(int i=maxPos-maxLength/2;i<=maxPos+maxLength/2;i++){
            if(chars[i]!='#'){
                tempChars[index]=chars[i];
                index++;
            }

        }

        return String.valueOf(tempChars);
    }

    private char[] pretreatmentPalindrome(char[] chars){
        //字符数组预处理,转换偶数长度的回文子串
        //如 abdcccs 转换成 #a#b#d#c#c#c#s#
        char[] newChars = new char[chars.length*2+1];
        for(int i=0;i<chars.length;i++){
            newChars[2*i]='#';
            newChars[2*i+1]=chars[i];
        }
        newChars[newChars.length-1]='#';
        return newChars;
    }

(4) 复杂度分析

空间复杂度:插入分隔符形成新串,占用了线性的空间大小;RL数组也占用线性大小的空间,因此空间复杂度是线性的。
时间复杂度:尽管代码里面有两层循环,通过amortized analysis我们可以得出,Manacher的时间复杂度是线性的。由于内层的循环只对尚未匹配的部分进行,因此对于每一个字符而言,只会进行一次,因此时间复杂度是O(n)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 151,829评论 1 331
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 64,603评论 1 273
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 101,846评论 0 226
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 42,600评论 0 191
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 50,780评论 3 272
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 39,695评论 1 192
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,136评论 2 293
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 29,862评论 0 182
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 33,453评论 0 229
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 29,942评论 2 233
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,347评论 1 242
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 27,790评论 2 236
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,293评论 3 221
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 25,839评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,448评论 0 181
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 34,564评论 2 249
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 34,623评论 2 249

推荐阅读更多精彩内容

  • 最长回文子串——Manacher 算法 1. 问题定义 最长回文字符串问题:给定一个字符串,求它的最长回文子串长度...
    果哥爸阅读 2,677评论 0 6
  • 问题定义 最长回文子串问题:给定一个字符串,求它的最长回文子串长度。 解法1:暴力解法 找到字符串的所有子串,判断...
    HITMiner阅读 637评论 0 2
  • 这次要记录的是一个经典的字符串的题目,也是一个经典的马拉车算法的实践。相信在很多地方都会考到或者问到这道题目,这道...
    柠檬乌冬面阅读 2,843评论 0 9
  • 最长回文串问题是一个经典的算法题。 0. 问题定义 最长回文子串问题:给定一个字符串,求它的最长回文子串长度。如果...
    曾会玩阅读 3,936评论 2 25
  • 问题:给定一个字符串,求它的最长回文子串长度。提示:如果一个字符串正着读和反着读是一样的,那它就是回文串。下面是一...
    KevinHwong阅读 477评论 0 0