什么是数组
数组是一种编程语言中的数据类型,还是一种最基础的数据结构。
数组如何实现随机访问
- 数组是一种线性表数据结构,用一组连续的内存空间存储相同类型的数据。
线性表:数据、链表、队列、栈
非线性表:图、树
数组随机访问寻址公式:
a[i]_address = base_address + i * data_type_size
得益于连续的内存空间和相同的数据类型,所以数组可以随机访问。但是对数组进行删除、插入操作时,需要进行大量的数据搬移工作。
ps: 链表适合插入、删除、时间复杂度O(1);数组支持随机访问,根据下标随机访问的时间复杂度为O(1)。即使是排序号的数组,进行二分查找,时间复杂度也是O(logn)。
低效的插入和删除
插入: 最好O(1) ,最坏O(n), 平均O(n)
特殊情况 数组无序时,直接把被插入位置的原数据k,移动到数组元素的最后,再把新数据放入对应位置。
删除: 最好O(1),最坏O(n),平均O(n)
特殊情况 不进行删除搬移,仅进行标记,当数组没有更多的空间时再触发真正的删除操作。
警惕数组的访问越界问题
在c语言中,只要不是访问受限的内存都可以自由访问。函数体内的局部变量存在栈上,且是连续压栈。在linux进程的内存布局中,栈区在高地址空间,从高向低增长。变量i和arr在相邻地址,且i比arr的地址大,所以arr越界1位的话正好访问到i。同时i和arr元素正好同类型,i被覆盖成0,所以无限循环。
容器和数组
ArrayList最大的优势就是可以将很多数组操作的细节封装起来。如数组插入、删除时需要搬移其他数据等,支持动态扩容(空间不足时自动扩容为1.5倍)。
注意动态扩容比较耗时,建议在创建时实现指定数据大小。
ArrayList无法存储基本类型,需要封装。
关注性能或者需要基本类型的前提下使用数组。
为什么数组从0开始
“下标”准确来说应该称为“偏移offset”。
如果用a标识首地址,a[0]就是偏移为0的地址,a[k]标识偏移k个type_size。
a[k]_address = base_address + k * type_size
如果从1开始
a[k]_address = base_address + (k-1)* type_size
不过最主要的可能是沿用了c语言的设计,用0开始计数数组下标。
此文章为2月Day1学习笔记,内容来源与极客时间《数据结构与算法之美》