javascript 數(shù)組去重的6種思路

AlphaWallet 發(fā)布于2019-08-26 11:39 / 2284人閱讀

摘要：但是這并不妨礙我們從思維拓展的角度出發(fā)，看看去重可以用幾種思路去實現(xiàn)。首先是常規(guī)的雙層循環(huán)比對的思路實現(xiàn)定義一個變量表示當前元素在中是否存在。依次對中的元素和原數(shù)組元素進行比對。重點是保證碰撞的幾率小到比中大獎還小就可以了。

前端在日常開發(fā)中或多或少都會碰到有對數(shù)據(jù)去重的需求，實際上，像是lodash這些工具庫已經(jīng)有成熟完備的實現(xiàn)，并且可以成熟地運用于生產(chǎn)環(huán)境。但是這并不妨礙我們從思維拓展的角度出發(fā)，看看去重可以用幾種思路去實現(xiàn)。

首先是常規(guī)的雙層循環(huán)比對的思路實現(xiàn)

function doubleLoopUniq(arr) {
  let result = [];
  for (let i = 0, len = arr.length, isExist; i < len; i++) {
    // 定義一個變量表示當前元素在 result 中是否存在。
    isExist = false;
    for (let j = 0, rLen = result.length; j < rLen; j++) {
      if (result[j] === arr[i]) {
        // 依次對result 中的元素 和 原數(shù)組元素進行比對。
        isExist = true;
        break;
      }
    }
    // 最后判斷如果不存在，則將此元素插入result
    !isExist && result.push(arr[i]);
  }
  return result;
}

借助 js內(nèi)置的indexOf 進行去重

function indexOfUniq(arr) {
  let result = [];
  for (let i = 0, len = arr.length; i < len; i++) {
    // 用indexOf 簡化了二層循環(huán)的流程
    if (result.indexOf(arr[i]) === -1) result.push(arr[i]);
  }
  return result;
}

排序后前后比對去重

function sortUniq(arr) {
  let result = [], last;
  // 這里解構(gòu)是為了不對原數(shù)組產(chǎn)生副作用
  [ ...arr ].sort().forEach(item => {
    if (item != last) {
      result.push(item);
      last = item;
    }
  });
  return result;
}

通過hashTable去重

function hashUniq(arr) {
  let hashTable = arr.reduce((result, curr, index, array) => {
    result[curr] = true;
    return result;
  }, {})
  return Object.keys(hashTable).map(item => parseInt(item, 10));
}

ES6 SET一行代碼實現(xiàn)去重

function toSetUniq(arr) {
  return Array.from(new Set(arr));
}

splice 去重（直接操作數(shù)組本身，帶副作用）

function inPlaceUniq(arr) {
  let idx = 0;
  while (idx < arr.length) {
    let compare = idx + 1;
    while (compare < arr.length) {
      if (arr[idx] == arr[compare]) {
        arr.splice(compare, 1);
        continue;
      }
      ++compare
    }
    ++idx;
  }
  return arr;
}

最后在nodejs下面簡單跑個測試，看看哪個效率高~

let data = [];
for (var i = 0; i < 100000; i++) {
  data.push(Math.random())
}

// 實現(xiàn)一個性能測試的裝飾器
function performanceTest(fn, descript) {
  var a = new Date().getTime();
  return function () {
    fn.apply(this, [].slice.call(arguments, 0));
    console.log(descript, new Date().getTime() - a)
  }
}

performanceTest(hashUniq, "hashTable")(data)
performanceTest(sortUniq, "sortUniq")(data)
performanceTest(toSetUniq, "toSetUniq")(data)
performanceTest(indexOfUniq, "indexOfUniq")(data)
performanceTest(doubleLoopUniq, "doubleLoopUniq")(data)
performanceTest(inPlaceUniq, "inPlaceUniq")(data)

結(jié)果如下

hashTable 168ms
sortUniq 332ms
toSetUniq 80ms
indexOfUniq 4280ms
doubleLoopUniq 13303ms
inPlaceUniq 9977ms

延伸思考：如果數(shù)組內(nèi)的元素是對象該怎么去重呢？

既然是引用類型，那么不免會使用到deepEqual，固然這種思路可以解答這道問題，但難免不夠高效。

從上面的測試中也可見通過new Set 和 hashTable 去重是最高效的。
所以毫無疑問，我們要基于這兩種方式去改造，我想用的是hashTable，
另一方面，為了降低深度比較帶來的耗時，我嘗試用JSON.stringify 將引用類型轉(zhuǎn)化為基本類型。

function collectionUniq(collection) {
  let hashTable = {};
  collection.forEach(item => {
    hashTable[JSON.stringify(item)] = true;
  })
  return Object.keys(hashTable).map(item => JSON.parse(item))
}

那么問題來了，我們都知道對象的屬性是無序的，假如數(shù)據(jù)是這種情況，那就GG了。

let collection = [ { a: 1, b: 2, c: 3 }, { b: 2, c: 3, a: 1 } ]

有一種toHash的思路，在對這個數(shù)組進行一次基本的去重之后，為了保證準確，
先遍歷JSON 字符串 =>
通過 charCodeAt()拿到每個字符串的 unicode 編碼 =>
相加得到一個總數(shù)，最后再兩兩進行比較，數(shù)值相等的就是重復的，這樣就達到去重的效果了。

function toHash(obj) {
  let power = 1;
  let res = 0;
  const string = JSON.stringify(obj, null, 2);
  for (let i = 0, l = string.length; i < l; i++) {
    switch (string[i]) {
      case "{":
        power *= 2
        break
      case "}":
        power /= 2
        break
      case " ":
      case "
":
      case "
":
      case "	":
      break
      default:
        res += string[i].charCodeAt(0) * power
    }
  }
  return res
}

這只是一個實現(xiàn)基本的思路，有很大的改進空間，為了減少hash碰撞的可能，可以對一些特殊字符進行權(quán)重的增減。

重點是保證碰撞的幾率小到比中大獎還小就可以了。

2018.2.8
上面是一個比較清奇的思路，常規(guī)的做法，實際上還是應(yīng)該從優(yōu)化深度比較的效率入手。
看到一個很好的實現(xiàn)思路，是一個優(yōu)先判錯的思路，通過預設(shè)各種前置條件來避免高代價的循環(huán)，這種思路盡管在數(shù)據(jù)量小的時候因為前置判斷可能有一些微乎其微的性能損耗，但是數(shù)據(jù)量越大，優(yōu)勢就越明顯了。感興趣的可以了解下。
https://github.com/epoberezki...

GPU云服務(wù)器云服務(wù)器數(shù)組去重 javascript思路數(shù)組去重 linux 6種模式

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://systransis.cn/yun/107306.html

發(fā)表評論

登陸后可評論

0條評論

AlphaWallet

男|高級講師

我要關(guān)注我要私信

TA的文章

iWebFusion：洛杉磯4G內(nèi)存套餐$9.38/月起,加$5可升級10Gbps帶寬

閱讀 1640·2021-10-25 09:46
了解RoboMaster視覺組（三）視覺組使用的軟件

閱讀 3235·2021-10-08 10:04
基于GSM遠程短信防盜報警系統(tǒng)

閱讀 2383·2021-09-06 15:00
Digicert：關(guān)于SSL證書域名驗證（DCV）策略變更通知

閱讀 2784·2021-08-19 10:57
獻禮“618”，1700+集前端視頻教程免費看

閱讀 2088·2019-08-30 11:03
移動端實現(xiàn)表頭固定，tbody滾動，三種方法

閱讀 989·2019-08-30 11:00
UCloud云主機KMS激活方式說明

閱讀 2389·2019-08-26 17:10
一篇文章帶你過一遍 TypeScript

閱讀 3559·2019-08-26 13:36

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

javascript 數(shù)組去重的6種思路

相關(guān)文章

JavaScript數(shù)組去重的6種算法

JavaScript數(shù)組去重（12種方法，史上最全）