
用归用,照葫芦画瓢不难,大家日常也是这么写的,没毛病!但是如果对一个方法不进行深入研究,那么就很容易踩坑,并且常常会填不了坑!
今天,我们重点聊聊比较函数 compareFunction 相关的知识。
为了接下来的思路能够更顺畅,在学习比较函数之前,我们先来了解一下有关插入排序的原理。
插入排序(Insertion-Sort)的算法描述是一种简单直观的排序算法。它的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。
算法描述:
一般来说,插入排序都采用 in-place 在数组上实现:
从第一个元素开始,该元素可以认为已经被排序;取出下一个元素,在已经排序的元素序列中从后向前扫描;如果该元素(已排序)大于新元素,将该元素移到下一位置;重复步骤3,直到找到已排序的元素小于或者等于新元素的位置;将新元素插入到该位置后;重复步骤2~5。
动图演示:
插入排序
其实可以用一句话总结:从数组中第二个元素起(第一个元素已默认排序),每个元素都充当一次游标值,依次和它前面的(已排序)的元素相比较,如果游标值小,则将拿来比较的元素向后移一位,继续向前比较;否则,将游标值插入比较值的后面,结束比较。
如果想要 sort() 方法按照一定的规则进行排序(比如数字大小),那么就需要给它指定比较函数 compareFunction。
如果指明了 compareFunction ,那么数组会按照调用该函数的返回值排序,它有两个参数 a 和 b,返回值如下:
如果 compareFunction(a, b) 小于 0 ,那么 a 会被排列到 b 之前。如果 compareFunction(a, b) 等于 0 , a 和 b 的相对位置不变。如果 compareFunction(a, b) 大于 0 , b 会被排列到 a 之前。compareFunction(a, b) 必须总是对相同的输入返回相同的比较结果,否则排序的结果将是不确定的。
我们暂不做什么复杂的分析,先使用控制台打印一下看看 a 和 b 到底是什么:
执行结果如下:
通过上图,我们可以看到:
a 的值在按照原数组中的顺序依次变化,这个排序采用的应该是插入排序法。a 代表的应该是游标。从 b 值的变化上又可以看出,a 首次找位置时采用了二分法,a < b 则向前比较, a>b 则向后比较。
那么,其机理到底是不是我们所看到这样一个过程,还需要再探究。
要想弄清楚一个问题,还有什么比从根源上着手效率更高的呢?所以我们追根溯源,先来扒一扒 v8引擎 的源码,看看它内部到底是怎么实现 sort 接口的。
其中 array.js 文件下,关于 sort 接口实现的代码如下:
代码分析:
v8 中实现 sort() 方法时,采用了 ”插入排序“ 和 ”快速排序“ 两种排序方式。对于短数组(长度 <=22)来说,插入排序效率更高。如果没有传入 comparefn ,则生成一个 comparefn 比较函数。在自动生成的比较函数中,会将传入的数组元素通过 TO_STRING 方法转换为字符串,再行比较。对比比较函数中的 b 为游标值,这一点和最新版的 chrome 浏览器表现不同。
我们在 sort 方法中传入的函数用在了这里:
根据我们传入函数的返回值,数组进行排序操作:
如果返回值(a-b)大于0,即 a > b, 则将当前拿来比较的值 a 复制给它的下一位,并继续使用游标值 b 向前进行比较。如果返回值小于等于 0 ,则结束比较,并将游标值 b 填在最后一次比较值 a 的后面。
不管是旧版本还是最新版本的 v8,它们的 sort() 方法的返回结果都没有发生变化,只是内部的实现机理有了改变(肯定是向着更优的方向改变)。
为了是 sort() 的返回结果符合预期,我们给它传入了一个函数作为比较规则。
在比较函数中,因 v8 版本不同,实现机制有差异,导致它的参数意义也不大相同,所以我们暂时无需关心它里面参数的具体含义。
比较函数如果写完全的话,应该是:
即比较函数的返回值严格来说只有三个:-1、0 和 1 。
我们主需要记住 return a – b 是升序排列,return b – a 是降序排列即可。