C#中生成的随机数为什么不随机?

2023/7/6 02:13:32

"csharp-generate-random

随机数生成方法可以说是任何编程语言必备的功能,它的重要性不言而言,在C#中我们通常使用Random类生成随机数,在一些场景下,我却发现Random生成的随机数并不可靠,在下面的例子中我们通过循环随机生成5个随机数:

<span style=color: blue;>for (<span style=color: blue;>int i = 0; i < 5; i++) { <span style=color: #2b91af;>Random random = <span style=color: blue;>new <span style=color: #2b91af;>Random(); <span style=color: #2b91af;>Console.WriteLine(random.Next()); }

<span style=color: #555555;>这段代码执行后的结果如下所示:

2140400647 2140400647 2140400647 2140400647 2140400647

通过以上结果可知,随机数类生成了5个相同的数,这并非我们的预期,为什么呢?为了弄清楚这个问题,零度剖析了微软官方的开源Random类,发现在C#中生成随机数使用的算法是线性同余法,经百科而知,这种算法生成的不是绝对随机,而是一种伪随机数,线性同余法算法的的公式是:

第N+1个数 = ( 第N个数 * A + B) % M

上面的公式中A、B和M分别为常数,是生成随机数的因子,如果之前从未通过同一个Random对象生成过随机数(也就是调用过Next方法),那么第N个随机数为将被指定为一个默认的常数,这个常数在创建一个Random类时被默认值指定,Random也提供一个构造函数允许开发者使用自己的随机数因子,这一切可通过微软官方开源代码看到:

<span style=color: blue;>public Random() : <span style=color: blue;>this(<span style=color: #2b91af;>Environment.TickCount)

<span style=color: blue;>public Random(<span style=color: blue;>int Seed)

通过默认构造函数创建Random类时,一个Environment.TickCount对象作为因子被默认传递给第二个构造函数,Environment.TickCount表示操作系统启动后经过的毫秒数,计算机的运算运算速度远比毫秒要快得多,这导致一个的具有毫秒精度的因子参与随机数的生成过程,但在5次循环中,我们使用了同一个毫秒级的因子,从而生成相同的随机数,另外,第N+1个数的生成与第N个数有着直接的关系。

在上面的例子中,假设系统启动以来的毫秒数为888毫秒,执行5次循环用时只有0.1毫秒,这导致在循环中创建的5个Random对象都使用了相同的888因子,每次被创建的随机对象又使用了相同的第N个数(默认为常数),通过这样的假设我们不难看出,上面的结果是必然的。

现在我们改变这个格局,在循环之外创建一个Random对象,在每次循环中引用它,并通过它生成随机数,并在同一个对象上多次调用Next方法,从而不断变化第N个数,代码如下所示:

<span style=color: #2b91af;>Random random = <span style=color: blue;>new <span style=color: #2b91af;>Random();

<span style=color: blue;>for (<span style=color: blue;>int i = 0; i < 5; i++) { <span style=color: #2b91af;>Console.WriteLine(random.Next()); }

执行后的结果如下所示:

391098894 1791722821 1488616582 1970032058 201874423

我们看到这个结果确实证实了我们上面的推断,第1次循环时公式中的第N个数为默认常数;当第二次循环时,第N个数为391098894,随后不断变化的第N个数作为因子参与计算,这保证了结果的随机性。

虽然通过我们的随机数看起来也很随机了,但必定这个算法是伪随机数,当第N个数和因子都相同时,生成的随机数仍然是重复的随机数,由于Random提供一个带参的构造函数允许我们传入一个因子,如果传入的因子随机性强的话,那么生成的随机数也会比较可靠,为了提供一个可靠点的因子,我们通常使用GUID产生填充因子,同样放在循环中测试:

<span style=color: blue;>for (<span style=color: blue;>int i = 0; i < 5; i++) { <span style=color: blue;>byte[] buffer = <span style=color: #2b91af;>Guid.NewGuid().ToByteArray(); <span style=color: blue;>int iSeed = <span style=color: #2b91af;>BitConverter.ToInt32(buffer, 0); <span style=color: #2b91af;>Random random = <span style=color: blue;>new <span style=color: #2b91af;>Random(iSeed); <span style=color: #2b91af;>Console.WriteLine(random.Next()); }

这样的方式保证了填充因子的随机性,所以生成的随机数也比较可靠,运行结果如下所示:

734397360 1712793171 1984332878 819811856 1015979983

在一些场景下这样的随机数并不可靠,为了生成更加可靠的随机数,微软在System.Security.Cryptography命名空间下提供一个名为RNGCryptoServiceProvider的类,它采用系统当前的硬件信息、进程信息、线程信息、系统启动时间和当前精确时间作为填充因子,通过更好的算法生成高质量的随机数,它的使用方法如下所示:

<span style=color: blue;>byte[] randomBytes = <span style=color: blue;>new byte[4]; <span style=color: #2b91af;>RNGCryptoServiceProvider rngServiceProvider = <span style=color: blue;>new <span style=color: #2b91af;>RNGCryptoServiceProvider(); rngServiceProvider.GetBytes(randomBytes); <span style=color: #2b91af;>Int32 result = <span style=color: #2b91af;>BitConverter.ToInt32(randomBytes, 0);

通过这种算法生成的随机数,经过成千上万次的测试,并未发现重复,质量的确比Random高了很多。另外windows api也提供了一个非托管的随机数生成函数CryptGenRandom,CryptGenRandom与RNGCryptoServiceProvider的原理类似,采用C++编写,如果要在.NET中使用,需要进行简单的封装。它的原型如下所示:

BOOL WINAPI CryptGenRandom( In HCRYPTPROV hProv, In DWORD dwLen, Inout BYTE *pbBuffer );

以上就是零度为您带来的随机数生成方法和基本原理,您可以通过需求和场景选择最佳的方式,Random算法简单,性能较高,适用于随机性要求不高的情况,由于RNGCryptoServiceProvider在生成期间需要查询上面提到的几种系统因子,所以性能稍弱于Random类,但随机数质量高,可靠性更好。"