转自:https://blog.csdn.net/u012108367/article/details/69913280
https://blog.csdn.net/qq_33547243/article/details/79054112
在医学统计学或者流行病学里的现场调查、样本选择经常会提到一个词:随机抽样。
随机抽样是为了保证各比较组之间均衡性的一个很重要的方法。那么今天介绍的第一个函数就是用于抽样的函数sample:
> x=1:10 > sample(x) [1] 8 9 5 2 3 10 6 1 4 7 #随机抽样,默认是不放回抽样 > sample(x,size = 5) [1] 9 4 5 6 2 #size参数,规定抽样个数 > sample(x,size = 5) [1] 4 3 1 5 9 #这次抽样结果和上次不同,证明是随机的 > sample(x,replace = T) [1] 5 5 8 8 7 3 3 7 6 2 #参数是否是放回抽样。
上述抽样过程中,每个元素被抽取的概率相等,称为随机抽样。
有时候我们的抽取元素的概率未必相等(如常见的二项分布概率问题),此时我们需要添加一个参数prob,也就是“probability”(概率)的缩写。假设一名医生给患者做某手术成功的概率是80%,那么现在他给20例病人做手术,可能有哪几次是成功的呢?代码如下:
这些代码告诉我们,对每一个元素都可以给定一个概率,且每个概率是独立的,即在参数prob中,不一定所有元素的概率加起来等于1,它只代表某元素被抽取的概率而已。
原文:https://www.cnblogs.com/BlueBlueSea/p/10177044.html