这只菜鸟总算搞懂了线性筛素数

96
Mr_Normal
2017.05.09 14:36* 字数 717

接触ACM已经两个星期了,感觉我每天的表情就是这样的

大佬们在讲什么.jpg

用四个字来形容就是菜不成声,总算搞明白了线性筛素数,Good for me!
先贴代码,再来讲解吧

最low

两个星期之前,如果你让我筛一下素数,我会告诉你很简单,然后一顿敲

#define SIZE 1000000

int main()
{
    int check[SIZE];
    int prime[SIZE] = {0};
    int pos;
    int flag;
    for (int i = 2 ; i < SIZE ; i++)
    {
        flag = 1;
        for (int j = 2 ; j < sqrt(i) ; j++)
        {
            if (i % j == 0)
                flag = 0;
        }
        if (flag == 1)
        {
            prime[pos++] = i;
        }
    }
    printf("%.2f", (double)clock()/CLOCKS_PER_SEC);
    
    return 0;
}
-------
Output:5.26

这么low的算法我真不好意思拿出来

普通筛素数

#define SIZE 1000000

int main()
{
    int check[SIZE] = {0};//元素值为0代表是素数
    int prime[SIZE] = {0};
    int pos=0;
    int flag;
    for (int i = 2 ; i < SIZE ; i++)
    {
        if (!check[i])//如果是素数
            prime[pos++] = i;

        for (int j = 2*i ; j < SIZE ; j += i)
        {
            check[j] = 1;
        }
    }
    printf("%.2f", (double)clock()/CLOCKS_PER_SEC);

    return 0;
}
------
Output:0.17

线性筛素数


#define SIZE 1000000
int main()
{
    int check[SIZE] = {0};//元素值为0代表是素数
    int prime[SIZE] = {0};
    int pos=0;
    int flag;
    for (int i = 2 ; i < SIZE ; i++)
    {
        if (!check[i])//如果是素数
            prime[pos++] = i;

        for (int j = 0 ; j < pos && i*prime[j] < SIZE ; j++)
        {
            check[i*prime[j]] = 1;//筛掉
            //标注一
            if (i % prime[j] == 0)
                break;
        }
    }

    printf("%.2f", (double)clock()/CLOCKS_PER_SEC);

    return 0;
}
------
Output:0.02

效率

从输出我们可以看到线性筛法速度最快,而第一种就呵呵了。

其实第一种不能算是筛素数,而是判断一个数是不是素数。筛素数是为了求得一个区间内的所有素数,而把不是素数的筛去。

下面对线性筛法和普通筛法进行比较,以便理解线性筛法中的注释的重要部分。

普通筛素数

  • 基本思想
    一次循环筛掉当前素数的倍数

  • 缺点

    • 存在重复筛选,比如6既可以被2筛掉,又可以被3筛掉。
    • 原因:任意一个整数可以写成一些素数的乘积 n=p1^a * p2^b * p3^c(话说简书什么时候能上LaTeX啊),其中p1<p2<p3,这样这个数n就能被p1,p2和p3筛掉
  • 解决方法:按照一个数的最小素因子筛去(也就是这里的p1)就可以啦,这也就有了线性筛素数

上个图,可能更好理解,这是普通筛法每次循环分别筛掉的数


sieve1.png

可以看到有很多重复筛选的,这里列出的范围较小,如果范围较大的话会更直观

线性筛素数

  • 基本思想
    当前数字是n=p1^a * p2^b * p3^c(p1<p2<p3且均为素数),一次循环筛除小于等于p1的素数乘以n得到的数。比如p1之前有pi,pj和pk三个素数,则此次循环筛掉pi*n,pj*n,pk*np1*n ,实现见代码的标注一prime 里的素数都是升序排列的,break时的prime[j] 就是这里的p1

  • 优点:没有重复筛同一个数

    • 原因:按照一个数的最小素因子筛选,比如6只按2筛去

这里不好理解,上图

sieve2.png

从图上我们看到,第一列筛掉的是最小素因子是2的数,第二列筛掉的是最小素因子为3的数,依次类推,可以把所有的合数都筛掉

因为是按照最小素因子筛选,所以可以保证每个数都只会被筛一遍

summation:当看不懂代码时,把自己当成计算机,一步一步地算,总会搞清楚的,虽然有时候这种方法很傻...

算法
Web note ad 1