上一节讲了链表相关的基础知识,有人可能会说基础知识我都掌握了,但是写链表代码还是很费劲怎么办?确实是这样的,想要写好链表代码并不是容易的事,尤其是那些复杂的链表操作,比如链表反转、有序链表合并等,写的时候非常容易出错。
为什么链表代码这么难写?究竟怎么样才能比较轻松的写出正确的链表代码呢?
只要愿意投入时间,我觉得大多数人都是可以学会的。比如,如果你真能花一整天或者一个周末,就去写链表反转这一个代码,多写几次,知道能毫不费力的写出bug free的代码,这个坎儿还会很难跨吗?
当然,自己有决心并且付出精力是成功的先决条件,除此之外,我们还需要掌握一些技巧和方法。下面我总结了几个写链表的代码技巧,如果能熟练掌握这几个技巧,叫上主动和坚持,轻松拿下链表代码完全没有问题。
理解指针或引用的含义
事实上,看懂链表的结构并不是很难,但是一旦把它和指针混在一起,就很容易让人摸不着头脑。所以要想写好链表代码,首先就要理解好指针。
有些语言有“指针”的概念,比如C语言,有些语言没有指针,取而代之的是“引用”,比如Java、Python等。不管是指针还是引用,实际上,它们的意思都是一样的,都是存储所指对象的内存地址。
接下来,我会拿C语言中的指针来讲解。如果你用的是Java或者其他语言也没关系,把它理解成引用就可以了。
实际上,对于指针的理解,只需要记住下面这句话就可以了:将某个变量赋值给指针,实际上就是将这个变量的地址赋值给指针,或者反过来说,指针中存储了这个变量的内存地址,指向了这个变量,通过指针就能找到这个变量。
在编写链表代码的时候,经常会有这样的代码:p->next = q,这行代码是说p结点中的next指针存储了q结点的内存地址。还有一个更复杂的,也是写链表代码经常用到的:p->next = p->next->next,意思是说p结点的next指针存储了p结点的下下一个结点的内存地址。
掌握了指针或者引用的概念,应该可以很轻松的看懂链表代码。
警惕指针丢失和内存泄露
不知道你有没有这样的感觉,写链表代码的时候指针指来指去,一会就不知道指针到哪里了。所以我们在写代码的时候,一定不要弄丢了指针。
如上图所示,当我们在a结点和b结点之间插入结点c,假设当前指针p指向结点a。如果我们将代码写成下面这个样子,就会发生指针丢失和内存泄露。
1 | p->next = c; // 将p的next指针指向c结点 |
当p->next指针在完成第一步操作之后,已经不再指向b结点了,而是指向结点c,因此,第二行代码相当于将c->next指针指向了自己。因此整个链表断裂成了两半,从结点b之后的所有结点都无法访问了。
对于有些语言来说,比如C语言,内存管理是由程序员负责的,如果没有手动释放结点对应的内存空间,就会产生内存泄露,所以,我们在插入结点时,一定要注意操作的顺序。要先将c结点的next指针指向b,再将a结点的next指针指向c,这样才不会丢失指针,导致内存泄露。
利用哨兵简化实现难度
首先,我们回顾一下单链表的插入、删除操作。如果我们在结点p之后插入一个结点,只需要下面两行代码就可以了。
1 | new_node->next = p->next; |
但是当我们向一个空链表中插入第一个结点,刚刚的逻辑就不能用了。我们需要进行下面这样的特殊处理,其中head表示链表的头结点。所以从这段代码可以看出,对于单链表的插入操作,第一个结点和其他结点的插入逻辑是不同的。
1 | if (head == null) |
同样再来看一下链表的删除操作,如果要删除p结点的后继点点,我们只需要一行代码就可以搞定:
1 | p->next = p->next->next; |
但是如果要删除链表的最后一个结点,这样的代码就不行了。跟插入类似,我们也需要对这种情况特殊处理。代码如下:
1 | if (head->next == null) |
可以看出,针对链表的插入、删除操作,需要对第一个结点的插入和最后一个结点的删除情况进行特殊处理。这样代码实现起来就会很繁琐,不简洁,而且也容易因为考虑不全而出错。那如何来解决这个问题呢?
这时上面提到的哨兵就出场了。现实中的哨兵,解决的是国家之间的边界问题。同理我们这里的哨兵也是解决“边界问题的”,不直接参与业务逻辑。
还记得如何表示一个空链表呢?head=null表示链表中没有结点了,其中head表示头结点指针,指向链表中的第一个结点。
如果我们引入哨兵结点,在任何时候,不管链表是不是为空,head指针都会一直指向这个哨兵结点。我们把这种有哨兵的链表叫做带头链表,相反,没有哨兵结点的链表叫做不带头链表。
如下我画了一个带头链表,可以发现,哨兵结点是不存储数据的。因为哨兵结点一直存在,所以插入第一个结点和插入其他结点,删除最后一个结点和删除其他结点,都可以统一为相同的代码实现逻辑。
实际上,这种利用哨兵简化编程难度的技巧,在很多代码实现中都有用到,比如插入排序、归并排序、动态规划等。这里用C语言实现一个简单的例子,不涉及语法方面的高级知识,你可以类比其他语言。
代码一:
1 | // 在数组a中,查找key,返回key所在的位置,其中n代表数组,a代表长度 |
代码二:
1 | // 在数组a中,查找key,返回key所在的位置,其中n代表数组,a代表长度 |
对比两段代码,在字符串a很长的时候,比如几万、几十万,你觉得那段代码执行更快呢?答案是代码二。因为两端代码中执行次数最多的就是while循环那一部分。在第二段代码中,我们通过一个哨兵a[n-1]=key,成功省掉了一个比较语句,不要小看了这一句,当积累上万次、几十万次的时候,累积的时间就很明显了。
当然,这里只是说明哨兵的作用,写代码的时候千万不要写成第二段代码那样,可读性太差了,大部分情况下,我们并不需要追求如此极致的性能。
重点留意边界条件处理
软件开发中,代码在以下边界或者异常情况下,最容易产生bug。链表代码也不例外,要实现没有bug的链表代码,一定要在编写的过程中以及编写完成后,检查边界条件是否考虑全面,以及边界条件下代码是否能运行。
我经常用来检查链表代码是否正确执行的边界条件有这么几个:
- 如果链表为空时,代码是否能正常工作?
- 如果一个链表只包含了一个结点,代码能否正常工作?
- 如果链表只包含两个结点时,代码能否正常工作?
- 代码逻辑在处理头结点和尾结点时,是否能正常工作?
当你写完链表代码之后,除了看下你写的代码在正常情况下能否工作,还要看下在上面我列举的杰哥边界条件下,代码能否正常工作。
当然边界条件不止我列举的这些,针对不同的场景,可能还有特定的边界条件,需要自己去思考,不过套路都是一样的。
其实,不光是写链表代码,在写任何代码的时候,千万不要只是实现业务正常情况下的功能就行了,一定要多想想会遇到哪些边界情况或者异常情况,遇到了应该如何应对,这样写出来的代码才够健壮。
举列画图,辅助思考
对于稍微复杂的链表操作,比如前面我们提到的单链表反转,指针一会指这,一会指那,总感觉脑容量不够,想不清楚。这时候可以采用举列法和画图法,来进行辅助分析。
你可以找一个具体的例子,把它画在纸上,释放一些脑容量,留更多的给逻辑思考,这样就会感觉思路清晰很多。比如往单链表中插入一个结点,可以先把各种情况都举一个例子,画出插入前和插入后的链表变化,如图所示:
看着图写代码,是不是简单多了。而且当我们写完代码之后,也可以举几个例子,画在纸上,照着代码走一遍,很容易发现代码中的Bug。
多写多练,没有捷径
如果你已经理解并掌握了这些方法,但是手写代码还是会出现各种各样的错误,也不要着急,多写多练。把常见的链表操作多写几遍,出问题就一点点调试,熟能生巧。
下面我精选了5个常见的链表操作,这要把这几个操作写熟练,不熟就多练几遍,保证之后不会在害怕写链表代码。
- 单链表反转
- 链表中环的检测
- 两个有序链表合并
- 删除链表倒数第n个结点
- 求链表的中间结点
我觉得,写链表代码是最考验逻辑思维能力的,因为链表到处都是指针的操作,边界条件的处理,一个不慎就会产生bug。链表代码写的好坏,可以看出一个人写代码是否细心,考虑问题是否全面,思维是否缜密,所以很多面试都喜欢让人手写链表代码。
1 | /** |