Python中的加權(quán)隨機

ThinkSNS 發(fā)布于2019-07-24 17:47 / 2169人閱讀

摘要：我們平時比較多會遇到的一種情景是從一堆的數(shù)據(jù)中隨機選擇一個大多數(shù)我們使用就夠了但是假如我們要選取的這堆數(shù)據(jù)分別有自己的權(quán)重也就是他們被選擇的概率是不一樣的在這種情況下就需要使用加權(quán)隨機來處理這些數(shù)據(jù)簡單線性方法下面是一種簡單的方案傳入權(quán)重的

我們平時比較多會遇到的一種情景是從一堆的數(shù)據(jù)中隨機選擇一個, 大多數(shù)我們使用random就夠了, 但是假如我們要選取的這堆數(shù)據(jù)分別有自己的權(quán)重, 也就是他們被選擇的概率是不一樣的, 在這種情況下, 就需要使用加權(quán)隨機來處理這些數(shù)據(jù)

1. 簡單線性方法

下面是一種簡單的方案, 傳入權(quán)重的列表(weights), 然后會返回隨機結(jié)果的索引值(index), 比如我們傳入[2, 3, 5], 那么就會隨機的返回0(概率0.2), 1(概率0.3), 2(概率0.5)

簡單的思路就是把所有的權(quán)重加和, 然后隨機一個數(shù), 看看落在哪個區(qū)間

import random

def weighted_choice(weights):
    totals = []
    running_total = 0

    for w in weights:
        running_total += w
        totals.append(running_total)

    rnd = random.random() * running_total
    for i, total in enumerate(totals):
        if rnd < total:
            return i

2. 加速搜索

上面這個方法看起來非常簡單, 已經(jīng)可以完成我們所要的加權(quán)隨機, 然是最后的這個for循環(huán)貌似有些啰嗦, Python有個內(nèi)置方法bisect可以幫我們加速這一步

import random
import bisect

def weighted_choice(weights):
    totals = []
    running_total = 0

    for w in weights:
        running_total += w
        totals.append(running_total)

    rnd = random.random() * running_total
    return bisect.bisect_right(totals, rnd)

bisect方法可以幫我們查找rnd在totals里面應(yīng)該插入的位置, 兩個方法看起來差不多, 但是第二個會更快一些, 取決于weights這個數(shù)組的長度, 如果長度大于1000, 大約會快30%左右

3. 去掉臨時變量

其實在這個方法里面totals這個數(shù)組并不是必要的, 我們調(diào)整下策略, 就可以判斷出weights中的位置

def weighted_choice(weights):
  rnd = random.random() * sum(weights)
  for i, w in enumerate(weights):
      rnd -= w
      if rnd < 0:
          return i

這個方法比第二種方法竟然快了一倍, 當(dāng)然, 從算法角度角度, 復(fù)雜度是一樣的, 只不過我們把賦值臨時變量的功夫省下來了, 其實如果傳進來的weights是已經(jīng)按照從大到小排序好的話, 速度會更快, 因為rnd遞減的速度最快(先減去最大的數(shù))

4. 更多的隨機數(shù)

如果我們使用同一個權(quán)重數(shù)組weights, 但是要多次得到隨機結(jié)果, 多次的調(diào)用weighted_choice方法, totals變量還是有必要的, 提前計算好它, 每次獲取隨機數(shù)的消耗會變得小很多

class WeightedRandomGenerator(object):
    def __init__(self, weights):
        self.totals = []
        running_total = 0

        for w in weights:
            running_total += w
            self.totals.append(running_total)

    def next(self):
        rnd = random.random() * self.totals[-1]
        return bisect.bisect_right(self.totals, rnd)

    def __call__(self):
        return self.next()

在調(diào)用次數(shù)超過1000次的時候, WeightedRandomGenerator的速度是weighted_choice的100倍

所以我們在對同一組權(quán)重列表進行多次計算的時候選擇方法4, 如果少于100次, 則使用方法3

5. 使用accumulate

在python3.2之后, 提供了一個itertools.accumulate方法, 可以快速的給weights求累積和

>>>> from itertools import accumulate
>>>> data  = [2, 3, 5, 10]
>>>> list(accumulate(data))
[2, 5, 10, 20]

如果你有更好的方法, 歡迎在留言區(qū)討論

參考文章: Weighted random generation in Python

本文發(fā)表在致趣技術(shù)團隊博客, 加入致趣

GPU云服務(wù)器云服務(wù)器 python加權(quán)聚類 python 隨機 python隨機森林 python隨機數(shù)字

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://systransis.cn/yun/37442.html

發(fā)表評論

登陸后可評論

0條評論

ThinkSNS

男|高級講師

我要關(guān)注我要私信

TA的文章

開源負(fù)載均衡器HAProxy嚴(yán)重安全漏洞易受關(guān)鍵HTTP請求走私攻擊

閱讀 1051·2021-09-13 10:29
【周刊-1】三年大廠面試官-面試題精選及答案

閱讀 3398·2019-08-29 18:31
WEB基礎(chǔ)之HTML的各個標(biāo)簽的默認(rèn)樣式

閱讀 2648·2019-08-29 11:15
vue的指令

閱讀 3022·2019-08-26 13:25
G6 2.0 開源發(fā)布 -- 裂變·聚變

閱讀 1381·2019-08-26 12:00
SCORM標(biāo)準(zhǔn)應(yīng)用編程接口（API）和數(shù)據(jù)模型（Data Model）學(xué)習(xí)及總結(jié)

閱讀 2324·2019-08-26 11:41
[打怪升級]小程序評論回復(fù)和發(fā)帖功能實戰(zhàn)（二）

閱讀 3423·2019-08-26 10:31
@vue/cli+webpack搭建多頁面應(yīng)用

閱讀 1498·2019-08-26 10:25

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

Python中的加權(quán)隨機

相關(guān)文章

**隨機加權(quán)平均 -- 在深度學(xué)習(xí)中獲得最優(yōu)結(jié)果的新方法**

Hive集群合并之應(yīng)用端的負(fù)載均衡算法

Node.js運行原理、高并發(fā)性能測試對比及生態(tài)圈匯總

發(fā)表評論

0條評論

ThinkSNS

男|高級講師

TA的文章

開源負(fù)載均衡器HAProxy嚴(yán)重安全漏洞易受關(guān)鍵HTTP請求走私攻擊

【周刊-1】三年大廠面試官-面試題精選及答案

WEB基礎(chǔ)之HTML的各個標(biāo)簽的默認(rèn)樣式

vue的指令

G6 2.0 開源發(fā)布 -- 裂變·聚變

SCORM標(biāo)準(zhǔn)應(yīng)用編程接口（API）和數(shù)據(jù)模型（Data Model）學(xué)習(xí)及總結(jié)

[打怪升級]小程序評論回復(fù)和發(fā)帖功能實戰(zhàn)（二）

@vue/cli+webpack搭建多頁面應(yīng)用

最新活動

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

Python中的加權(quán)隨機

相關(guān)文章

發(fā)表評論

0條評論

男|高級講師

TA的文章

最新活動

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！