准备刷 leetcode 了,才发现自己连时间复杂度都不懂

原文地址 https://juejin.im/post/5e7c0946f265da42e879fe0c

高级工程师 title 的我,最近琢磨着好好刷刷算法题更高级一些,然鹅,当我准备回忆大学和面试时候学的数据结构之时,我发现自己对这个算法复杂度的记忆只有 OOOOOooo

文章收录在 GitHub JavaKeeper ,N 线互联网开发必备技能兵器谱

算法(Algorithm)是指用来操作数据、解决程序问题的一组方法。对于同一个问题,使用不同的算法,也许最终得到的结果是一样的,但在过程中消耗的资源和时间却会有很大的区别。

那么我们应该如何去衡量不同算法之间的优劣呢?

主要还是从算法所占用的「时间」和「空间」两个维度去考量。

  • 时间维度:是指执行当前算法所消耗的时间,我们通常用「时间复杂度」来描述。
  • 空间维度:是指执行当前算法需要占用多少内存空间,我们通常用「空间复杂度」来描述。

因此,评价一个算法的效率主要是看它的时间复杂度和空间复杂度情况。然而,有的时候时间和空间却又是「鱼和熊掌」,不可兼得的,那么我们就需要从中去取一个平衡点。

时间复杂度

一个算法执行所耗费的时间,从理论上是不能算出来的,必须上机运行测试才能知道。但我们不可能也没有必要对每个算法都上机测试,只需知道哪个算法花费的时间多,哪个算法花费的时间少就可以了。并且一个算法花费的时间与算法中语句的执行次数成正比例,哪个算法中语句执行次数多,它花费时间就多。一个算法中的语句执行次数称为语句频度或「时间频度」。记为 T(n)。

时间频度 T(n) 中,n 称为问题的规模,当 n 不断变化时,时间频度 T(n) 也会不断变化。但有时我们想知道它变化时呈现什么规律,为此我们引入时间复杂度的概念。算法的时间复杂度也就是算法的时间度量,记作:T(n) = O(f(n))。它表示随问题规模 n 的增大,算法执行时间的增长率和 f(n) 的增长率相同,称作算法的渐进时间复杂度,简称「时间复杂度」。

这种表示方法我们称为「 大 O 符号表示法 」,又称为渐进符号,是用于描述函数渐进行为的数学符号

常见的时间复杂度量级有:

  • 常数阶
  • 线性阶
  • 平方阶
  • 立方阶
  • 对数阶
  • 线性对数阶
  • 指数阶

常数阶

,表示该算法的执行时间(或执行时占用空间)总是为一个常量,不论输入的数据集是大是小,只要是没有循环等复杂结构,那这个代码的时间复杂度就都是 O(1),如:

1
2
3
4
int i = 1;
int j = 2;
int k = i + j;
复制代码

上述代码在执行的时候,它消耗的时候并不随着某个变量的增长而增长,那么无论这类代码有多长,即使有几万几十万行,都可以用来表示它的时间复杂度。

线性阶

,表示一个算法的性能会随着输入数据的大小变化而线性变化,如

1
2
3
4
5
for (int i = 0; i < n; i++) {
j = i;
j++;
}
复制代码

这段代码,for 循环里面的代码会执行 n 遍,因此它消耗的时间是随着 n 的变化而变化的,因此这类代码都可以用来表示它的时间复杂度。

平方阶

表示一个算法的性能将会随着输入数据的增长而呈现出二次增长。最常见的就是对输入数据进行嵌套循环。如果嵌套层级不断深入的话,算法的性能将会变为立方阶),),以此类推

1
2
3
4
5
6
7
for(x=1; i<=n; x++){
for(i=1; i<=n; i++){
j = i;
j++;
}
}
复制代码

指数阶

,表示一个算法的性能会随着输入数据的每次增加而增大两倍,典型的方法就是裴波那契数列的递归计算实现

1
2
3
4
5
6
7
int Fibonacci(int number)
{
if (number <= 1) return number;

return Fibonacci(number - 2) + Fibonacci(number - 1);
}
复制代码

对数阶

1
2
3
4
5
6
int i = 1;
while(i<n)
{
i = i * 2;
}
复制代码

上面的代码,在 while 循环里面,每次都将 i 乘以 2,乘完之后,i 距离 n 就越来越近了,直到 i 不小于 n 退出。我们试着求解一下,假设循环次数为 x,也就是说 2 的 x 次方等于 n,则由 2^x=n 得出 x=log₂n。因此这个代码的时间复杂度为

线性对数阶

线性对数阶),就是将时间复杂度为对数阶的代码循环 n 遍的话,那么它的时间复杂度就是 n * O(logN),也就是了,如下,

1
2
3
4
5
6
7
8
9
for(m=1; m<n; m++)
{
i = 1;
while(i<n)
{
i = i * 2;
}
}
复制代码

除此之外,其实还有平均情况复杂度、最好时间复杂度、最坏时间复杂度。。。一般没有特殊说明的情况下,都是值最坏时间复杂度。

空间复杂度

空间复杂度(Space Complexity)是对一个算法在运行过程中临时占用存储空间大小的一个量度,同样反映的是一个趋势,一个算法所需的存储空间用 f(n) 表示。S(n)=O(f(n)),其中 n 为问题的规模,S(n) 表示空间复杂度。

一个算法在计算机存储器上所占用的存储空间,包括存储算法本身所占用的存储空间,算法的输入输出数据所占用的存储空间和算法在运行过程中临时占用的存储空间这三个方面。

一般情况下,一个程序在机器上执行时,除了需要存储程序本身的指令、常数、变量和输入数据外,还需要存储对数据操作的存储单元。若输入数据所占空间只取决于问题本身,和算法无关,这样只需要分析该算法在实现时所需的辅助单元即可。若算法执行时所需的辅助空间相对于输入数据量而言是个常数,则称此算法为原地工作,空间复杂度为 O(1)。当一个算法的空间复杂度与 n 成线性比例关系时,可表示为,类比时间复杂度。

空间复杂度比较常用的有:O(1)、O(n)、O(n²)

空间复杂度

如果算法执行所需要的临时空间不随着某个变量 n 的大小而变化,即此算法空间复杂度为一个常量,可表示为 O(1) 举例:

1
2
3
4
5
6
int i = 1;
int j = 2;
++i;
j++;
int m = i + j;
复制代码

代码中的 i、j、m 所分配的空间都不随着处理数据量变化,因此它的空间复杂度 S(n) = O(1)

空间复杂度

1
2
3
4
5
6
7
int[] m = new int[n]
for(i=1; i<=n; ++i)
{
j = i;
j++;
}
复制代码

这段代码中,第一行 new 了一个数组出来,这个数据占用的大小为 n,这段代码的 2-6 行,虽然有循环,但没有再分配新的空间,因此,这段代码的空间复杂度主要看第一行即可,即 S(n) = O(n)

复杂度速查表

来源:liam.page/2016/06/20/… 源地址:www.bigocheatsheet.com/

图例

大 - O 复杂度曲线

抽象数据结构的操作复杂度

数组排序

图操作

堆操作

参考

《大话数据结构》 zhuanlan.zhihu.com/p/50479555