当前位置: 首页 > news >正文

中国建筑网建设通进行查询证件查询seo顾问收费

中国建筑网建设通进行查询证件查询,seo顾问收费,手机端网站制作教程,wordpress 去掉index.php题目: 假设有一组数据流元素有 N 个(事先不知道 N 具体值),我们希望选择 n 个样本(N > n),使用怎样的策略进行抽样可以使得数据流中每个元素被选择的概率恰为 n / N 结论: 创建大…

 题目:

假设有一组数据流元素有 N 个(事先不知道 N 具体值),我们希望选择 n 个样本(N >= n),使用怎样的策略进行抽样可以使得数据流中每个元素被选择的概率恰为 n / N

结论:

创建大小为n的容器,先把前n个放进去,然后第i个(从n+1开始)有n/i的概率保留,随机和n个已保留的元素之一交换,有1-n/i的概率舍弃

证明:

1.数学归纳法:

        ①当N=n时,每个样本都选择概率都为n/N,显然成立。

        ②当N>n时,设k=N-1,则N=k+1,按照策略,前k个每个保留的概率为n/k(第k+1个元素未操作前),第k+1个保留的概率为n/(k+1),对于前k个任意一个元素,保留的概率:(n/k)*(((n/(k+1))*((n-1)/n)+(1-n/(k+1))=n/(k+1)=n/N,其实就是第k+1个保留且未换到该元素或者第k+1个未保留的概率×该元素原来保留的概率。

        ③所以当N>=n时,每个样本选择概率都为n/N。

 2.分类推理法:

        按照该策略,对于前n个元素,第i个(i>n)个元素后还保留的概率为(n/i)*((n-1)/n)+(i-n)/i=(i-1)/i

那么到第N个元素还保留的概率:1*(n/(n+1)*((n+1)/(n+2))*...*(N-1)/N=n/N

那么对于第i个元素(i>n)最后保留的概率,(n/i)*(i/(i+1)*...*(N-1)/N=n/N

所以对于所有元素,选择概率都为n/N

 代码实现:

 

import randomdef reservoir_sampling(stream, k):reservoir = []# 填充蓄水池,取前k个元素for i in range(k):reservoir.append(stream[i])# 对于第k个元素后的每个元素for i in range(k, len(stream)):# 随机生成一个数r,0 <= r < i+1r = random.randint(0, i)# 如果r小于k,则用当前元素替换蓄水池中的第r个元素if r < k:reservoir[r] = stream[i]return reservoirstream = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
k = 4
reservoir = reservoir_sampling(stream, k)
print(reservoir)  # 输出蓄水池中的抽样结果

http://www.rdtb.cn/news/22978.html

相关文章:

  • 网站竞价难做优化打开百度
  • 学电脑哪家好seo是什么职位的简称
  • 网站运营与管理期末考试亚洲精华国产精华液的护肤功效
  • 河源网站制作1993seoseo 0xu
  • 免费自己做网站软件信息流广告
  • 沭阳网站开发黄冈seo顾问
  • 嘉兴类网站系统总部宁波优化系统
  • 广安门外网站建设网站制作基本流程
  • 网站一般做多大的不收费推广网站有哪些
  • wordpress添加自定义字段广州seo关键词优化费用
  • 广州监狱门户网站官网最受欢迎的十大培训课程
  • 月饼网站建设合肥网络推广培训学校
  • 专门做反季的网站天津网站建设公司
  • 更改网站文章上传时间上海搜索排名优化
  • 政府三级网站制度建设天津百度网站快速排名
  • 做网站各个流程创建网站教程
  • 网站开发技术发展百度推广托管
  • C2C电子商务网站管理系统网上接单平台
  • 建设银行网站怎么登陆站长工具 站长之家
  • 合肥网站建设工作百度客服电话是多少
  • 网站推广软件价格建网站模板
  • 手机做点击赚钱的网站全网关键词搜索
  • 广州网站设计制作报价重庆整站seo
  • 杭州做网站外包公司哪家好北京网站优化经理
  • 一些设计网站seo自动优化软件
  • 做旅游宣传网站的流程推广赚钱一个2元
  • 外贸网站如何引流海淀区seo多少钱
  • 淘客网站怎么做首页千万别在百度上搜别人名字
  • 网站变慢的原因竞价推广开户多少钱
  • 做网站配什么电脑国外域名注册网站