算法入门:由一个小Case意识到时间复杂度的重要性

曾经听说过这样一句话,“程序=算法+数据结构”。当时感触真心不是很深。但是,随着工作的深入越来越意识到这个公式是有道理的。最近在实际工作中碰到了一些问题,其实是一个很简单的case。对于两个文件里有两类手机号,需要进行去重(在文件1中去掉文件2中存在的手机号)。其实是一个很简单的case,但是让我纠结了很长时间,其实是工作量和效率的抉择,我想到了以下解决方案。
1.暴力排重:将文件1中的手机号进行排序去重,之后依次去文件2中进行查找,其实这样的方法是很慢的。但是,在Linux下是不需要复杂的编程的。
(1).遍历文件一中的每一行,去文件2中grep,但是这样是十分低效的。
(2).awk遍历两个文件,以手机号为数组索引,进行计数,数量>=2的为重复的手机号,去掉!。
其实上面两种办法是可行的,但是效率很低,文件一50W,文件二5000左右,跑了近一个小时。
2.Hash的方法,我主要是java和python栈的程序员,java不多说,写时间长了,编译和打包的过程是比较痛苦的,利用java的HashMap或者py的dic可以解决这个问题,估计也是绝大多数人的选择。效率其实还是很高的,毕竟hash的结构还是很高效的。但是需要写程序,各种io,put等。
3.位运算,这种方法是在编程珠玑里面学到的,主要是节省空间,同时也比较快,但是对于位的控制也是比较困难。但是对于对于数据量比较大的case十分可观。但是如果数据都是字符串而不是数字,那么位运算就不能用了,由此我又想到了bloom filter。但是bloom filter的开发成本比较高,我也是用github上的开源版实现了一下。如果不是数据量很大,那么用这种方法真心有点入不敷出啊。

通过这个事情,我也意识到了,算法离我这个小码农并不远。

说一下我对算法的时间复杂度的理解:
算法的时间复杂度在我看来就是一个算法执行的时间随着输入量级增加而变化的趋势。主要用大O表示法进行衡量,主要是反映算法运行时间随着输入量级的变化关系。

以一个小Case说一下自己的见解——冒泡排序

冒泡排序基本是每一个学过C语言或者其他编程语言都学过的一个排序算法了,众所周知,它是很低效的。为什么低效,简单的理解就是它遍历了n次,时间复杂度为指数级的。
先贴一下代码:

public class Sort {
   public static void DataSort(int b[]) {
       for (int i = 0; i < b.length; i++) {
           for (int j = 0; j < b.length - i - 1; j++) {
               int temp = 0;
               if (b[j] > b[j + 1]) {
                   temp = b[j];
                   b[j] = b[j + 1];
                   b[j + 1] = temp;
               }
           }
       }
       PrintSort(b);
   }
   public static void PrintSort(int c[]) {
       for (int k = 0; k < c.length; k++) {
           System.out.println(c[k]);
       }
   }
   public static void main(String[] args) {
       int a[] = { 12, 34, 5, 65, 87, 45, 565, 8, 4, 3, 56, 65 };
       DataSort(a);
   }
}

我们可以粗略的看一下它整个排序过程中会运行多少次,假设我们输入数据量大小是n。那么我们有双重循环:
第一次:内层循环为n-1
第二次:因为第一层循环的i增加了,也就意味着下一层循环的次数会减小,为n-2
第三次:和第二次一样,次数为n-2
....
第n-1次:内层循环只进行了一次1

综上,我们可以计算出总的循环次数为n-1+n-2+n-3.....+1.
其实这是个等差数列,结果为:n^2/2+n/2
学过高数的大家知道,这是一个以n为自变量的二次函数的曲线:

Paste_Image.png

可以看出来,随着n的增加,输出的增长十分迅速,所以这是一种很不好的算法,对于大规模的输入,计算的复杂度大大增加。

回头来看这个公式:n^2/2+n/2 对于n的逐渐增大,那么后面一次方的影响将会越来越小,同时秉着时间复杂度是反映算法运算趋势的原则,那么我们将冒泡排序的时间复杂度记为O(n^2)。

冒泡排序确实不是一个很好的排序算法,它的时间复杂度为平方级别的,同时还是有很多优秀的算法像堆排,快排和归并等。后续也会一一系统学习。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,425评论 4 361
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,058评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,186评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,848评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,249评论 3 286
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,554评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,830评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,536评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,239评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,505评论 2 244
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,004评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,346评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,999评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,060评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,821评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,574评论 2 271
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,480评论 2 267

推荐阅读更多精彩内容

  • 通常,对于一个给定的算法,我们要做 两项分析。第一是从数学上证明算法的正确性,这一步主要用到形式化证明的方法及相关...
    西域小码阅读 1,819评论 0 11
  • 总结一下常见的排序算法。 排序分内排序和外排序。内排序:指在排序期间数据对象全部存放在内存的排序。外排序:指在排序...
    jiangliang阅读 1,269评论 0 1
  • 排序的分类可以分为两种:内排序和外排序。 在排序过程中,全部记录放在内存,则称为内排序,如果排序过程中要使用外村,...
    親愛的破小孩阅读 1,070评论 0 1
  • 不知从何说起,十月,原本就是我最忙碌的一个月,生日纪念日都集中在这个月,那心中的小雀跃也集中在这个月,心中有期待,...
    君_4816阅读 239评论 1 2
  • 简书的第一次怎么能不送给我最爱的美食?作为一名正宗湘妹子的我从小就爱吃辣,没事也就喜欢在家瞎倒腾吃的,来解解谗嘴。...
    不爱吃芹菜的谢小姐阅读 134评论 0 1