具有任何编程经验的人都知道计算机是确定性机器。如果你提供相同的输入,则将始终获得相同的输出。这就是为什么让计算机偶然生成随机数比看起来复杂的多。
随机数应用在密码学到博彩,视频游戏等很多行业。但是,计算机天生就不能随机。相反,程序员依靠伪随机数生成器(PRNG),从称为种子/seed的给定起始值以编程方式生成新的随机数。
这些算法有其自身的局限性。由于随机数是通过程序生成的,因此,如果有人能够识别出使用的种子值和PRNG算法,他们将能够预测序列中的下一个随机数。这将使攻击者可以解密,预测序列中的下一张纸牌,在视频游戏中作弊等。
但是PRNG在涉及建模和仿真的情况下仍然非常有用,因为它允许通过使用相同的种子初始化随机数生成器来“重播”一系列随机事件。
在随机性第一的场景下,我们使用“真”随机数生成器(TRNG)。与具有任意种子值的PRNG不同,TRNG从其环境/外部数据中选择一个种子值。
以下是一些潜在的选择:
只需要选择攻击者无法预测的种子即可。然后,该种子值将被传递到类似于PRNG的算法中,该算法将生成一个随机数。
PRNG比TRNG更快,PRNG的确定性在你要重播一系列“随机”事件的情况下非常有用。
此外,某些PRNG算出的随机数,本质上是周期性的,有一定的确定概率,但是使用好的初始化参数的现代PRNG,这个周期可以足够长。
相反,TRNG比PRNG慢,没有确定性,并且不是周期性的。
实现一个简单的PRNG。一个称为线性同余生成器(LCG)算法的变体。LCG以前是最常用和研究最多的PRNG之一(https://en.wikipedia.org/wiki/Linear_congruential_generator)。
这是LCG的迭代算法:
LCG上的Wikipedia页面(https://en.wikipedia.org/wiki/Linear_congruential_generator)记录了一些常用的模数m,乘数a和增量值c。关于最佳值的建议尚无统一看法,因此各个实现之间存在不同的值。
我们必须注意这些参数的取值。选择错误的值可能会导致创建一个过短的周期,从而使我们的随机数生成器无用。
在下图中,可以看到对参数的微小更改会极大地影响周期长度。
这里使用早期C语言标准(C90 / C99 / ANSI C和C11)中记录的值。
a = 1103515245
m = 2³¹
c = 12345
无论选择哪种PRNG算法,都应导致随机数的均匀分布和足够长的时间。
import Foundation
final class LCG{
static func generate(modulus: Int, multiplier: Int, increment: Int, seed: Int) -> Int {
return (multiplier * seed + increment) % modulus
} // Generating 100 random numbers using LCG var seed = 0for _ in 0..<100 { let randomNumber = LCG.generate(modulus: 2147483648, multiplier: 1103515245, increment: 12345, seed: seed) seed = randomNumber print(randomNumber)}
假设你要模拟骰子投掷。github地址:
https://gist.github.com/aryamansharda/070d508ee6c61d168d06d5aea9ecf946#file-linearcongruentialgenerator-dice-swift
将模数设置为6似乎很合理,但这会导致周期太短而无法使用。所以这里需要对最后的随机数结果取模6处理。
var seed = 0
for _ in 1...40000 {
let randomNumber = LCG.generate(modulus: 2147483648, multiplier: 1103515245, increment: 12345, seed: seed)
seed = randomNumber
let diceRoll = 1 + (randomNumber % 6)
print(diceRoll)
}
使用上面的代码,模拟40,000次骰子掷骰,查看结果,可以看到结果确实是均匀分布。