經(jīng)典算法：隨機(jī)抽樣

awesome23 發(fā)布于2019-07-30 18:39 / 1169人閱讀

摘要：最近發(fā)現(xiàn)兩個(gè)比較有意思的隨機(jī)抽樣算法，分享一下隨機(jī)抽樣且保持有序需求一家公司購(gòu)買了他們的第一批電腦，該公司的業(yè)務(wù)主要是民意調(diào)查，現(xiàn)在要開發(fā)一個(gè)程序程序的輸入是選區(qū)名列表以及整數(shù)，輸出是隨機(jī)選擇的個(gè)選區(qū)名列表。

最近發(fā)現(xiàn)兩個(gè)比較有意思的隨機(jī)抽樣算法，分享一下

1. 隨機(jī)抽樣且保持有序

需求:

一家公司購(gòu)買了他們的第一批電腦，該公司的業(yè)務(wù)主要是民意調(diào)查，現(xiàn)在要開發(fā)一個(gè)程序：程序的輸入是選區(qū)名列表以及整數(shù) m，輸出是隨機(jī)選擇的 m 個(gè)選區(qū)名列表。通常選區(qū)名有幾百個(gè)，m 通常在 20 ~ 40。

程序描述:

程序的輸入包含兩個(gè)整數(shù) m 和 n，其中 m
簡(jiǎn)單點(diǎn)來(lái)說(shuō)，就是有 n 個(gè)數(shù)， 隨機(jī)取 m 個(gè)，并保持有序。
解法:
我們知道了 n 和 m，輪流判斷 n 個(gè)數(shù)組成的列表中每個(gè)數(shù)的概率(m/n)，每次判斷后n=n-1，若當(dāng)前被判斷的數(shù)被選擇，則m=m-1，否則 m 不變。
假設(shè) 5 個(gè)數(shù)選 2 個(gè)，那么意味著每個(gè)數(shù)的概率都是 2/5 。我們以 2/5 的概率去判斷第 1 個(gè)數(shù)，那么結(jié)果有兩種，選擇1，不選擇。當(dāng)判斷第 2 個(gè)的時(shí)候，在以選擇了第 1 個(gè)數(shù)的情況下，選擇 2 的概率是 (2-1)/(5-1)=1/4，在以沒(méi)選擇第 1 個(gè)數(shù)的情況下，選中 2 的概率是 2/(5-1)=2/4，所以第二個(gè)數(shù)的概率：(2/5)*(1/4) + (3/5)*(2/4) = 2/5。第二個(gè)數(shù)的概率和第一個(gè)數(shù)的概率相等。
證明:

實(shí)現(xiàn):
# Python
import random
# 抽樣，從n個(gè)中抽m個(gè)
def sampling(lists, m, n=None):
    selected = []
    if n is None:
        n = len(lists)
    remaining = n-1
    for i in range(n):
        # random.random()返回 0 ~ 1的隨機(jī)數(shù)
        if random.random() * remaining < m:
            selected.append(lists[i])
            m -= 1
        remaining -= 1
    return selected
# test
lists = [i for i in range(10)]
print sampling(lists, 3)
# 結(jié)果
>>>[4, 5, 7]
2. 在不知道總數(shù)的情況下隨機(jī)選一個(gè)
如何從 n 個(gè)對(duì)象（可以依次看到這 n 個(gè)對(duì)象，但事先不知道 n 的值）中隨機(jī)選取一個(gè)？例如，如何在事先不知道文本行數(shù)的情況下讀取該文件，從中隨機(jī)選擇并輸出一行？
解法:
我們先設(shè)一個(gè)變量叫selected，選擇第 1 行賦值給 selected，并以 1/2 的概率選擇第 2 行并重新賦值給selected， 以 1/3 的概率選擇第 3 行并重新賦值給selected。在這以過(guò)程結(jié)束時(shí)， 每一行的選中概率都是相等的（都是 1/n， 其中 n 是文件的總行數(shù)）
要證明這個(gè)概率可以從最后一行算起,設(shè)最后一行的概率為P(n)=1/n, 倒數(shù)第二行的概率為P(n-1)=(1-P(n))*(1/(n-1)) = 1/n,倒數(shù)第m-1行概率為：

代碼：
# Python
import random

def getRandLine(text):
    i = 1
    selected = ""
    for line in text.splitlines():
        if (random.random() < (1.0/i)):
            selected = line
        i += 1
    return selected
# test
text = """
line1
line2
line3
line4
line5
line6
line7
line8
line9
line10
""" 
print getRandLine(text)
# 結(jié)果
>>>line9
參考: 編程珠璣

云服務(wù)器 GPU云服務(wù)器隨機(jī)排列算法人臉檢測(cè)經(jīng)典算法學(xué)習(xí)算法的經(jīng)典 JAVA經(jīng)典算法

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://systransis.cn/yun/42828.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

awesome23

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

Postman接口測(cè)試工具

閱讀 2305·2021-09-30 09:47
??Python異常捕獲和處理??保姆式教學(xué)，代碼異常報(bào)錯(cuò)也能那么和諧且個(gè)性！

閱讀 2223·2021-09-26 09:55
如何在CentOS 8系統(tǒng)鏡像部署Memcached緩存工具？

閱讀 2954·2021-09-24 10:27
禁止eclipse校驗(yàn)JavaScript

閱讀 1543·2019-08-27 10:54
微信二次分享報(bào)錯(cuò)，invalid signature

閱讀 971·2019-08-26 13:40
開發(fā)中常用的JS知識(shí)點(diǎn)集錦

閱讀 2499·2019-08-26 13:24
Vue動(dòng)態(tài)加載異步組件

閱讀 2423·2019-08-26 13:22
react后臺(tái)獲取數(shù)據(jù)調(diào)用CallBack立即使用

閱讀 1735·2019-08-23 18:38

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！

經(jīng)典算法：隨機(jī)抽樣

相關(guān)文章

**用Python寫算法 | 蓄水池算法實(shí)現(xiàn)隨機(jī)抽樣**

Appboy 基于 MongoDB 的數(shù)據(jù)密集型實(shí)踐

關(guān)于深度學(xué)習(xí)(deep learning)

發(fā)表評(píng)論

0條評(píng)論

awesome23

男|高級(jí)講師

TA的文章

Postman接口測(cè)試工具

??Python異常捕獲和處理??保姆式教學(xué)，代碼異常報(bào)錯(cuò)也能那么和諧且個(gè)性！

如何在CentOS 8系統(tǒng)鏡像部署Memcached緩存工具？

禁止eclipse校驗(yàn)JavaScript

微信二次分享報(bào)錯(cuò)，invalid signature

開發(fā)中常用的JS知識(shí)點(diǎn)集錦

Vue動(dòng)態(tài)加載異步組件

react后臺(tái)獲取數(shù)據(jù)調(diào)用CallBack立即使用

最新活動(dòng)

資訊專欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！

經(jīng)典算法：隨機(jī)抽樣

相關(guān)文章

發(fā)表評(píng)論

0條評(píng)論

男|高級(jí)講師

TA的文章

最新活動(dòng)

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！