2016/02/04

RSA算法(4) RSA算法原理


公钥私钥生成

前面几张已经介绍了相关的数学知识,包括有互质关系,欧拉函数,模反元素,求最大公约数,快速幂取模,贝祖定理。有了这些知识,就可以容易理解RSA算法了。

我们通过一个例子来理解RSA算法。假设爱丽丝要与鲍勃进行加密通信,他们将如何使用公钥和私钥进行加密通信?

/blog/img/rsa4_01.png


第一步,随机选择两个不相等的质数p和q

爱丽丝选择了61和53。(实际应用中,这两个质数越大,就越难破解)


第二步,计算p和q的乘积n

n = 61*53 = 3233

n的长度就是秘钥的长度。3233写成二进制就是110010100001,一共有12位,所以这个秘钥就是12位。实际应用中,RSA秘钥一般是1024位,重要场合则为2048位。


第三步,计算n的欧拉函数φ(n)

φ(n) = (p-1)(q-1)

爱丽丝算出φ(3233)=60*52=3120。


第四步,随机选择一个整数e,条件是1< e < φ(n),且e与φ(n) 互质

我们选择17。(在实际情况中e不计算,只选取一个固定的质数,通常为质数65537)


第五步,计算e和φ(n)的模反元素d

两个数互质,根据模反元素,如果两个正整数a和n互质,那么一定可以找到整数b,使得ab-1被n整除。

ed ≡ 1(mod φ(n))

这个式子等价于:

ed-1 = kφ(n)
ed-kφ(n) = 1

已知两个数互质,它们最大公约数为1。所以根据贝祖定理:

ex + φ(n)y = 1

根据恒等定理可知,x==d, y==-k,也就是说我们只要求得贝祖定理的(x,y),就可以知道d。

已知 e=17, φ(n)=3120

17x + 3120y = 1

这个方程可以用"扩展欧几里得算法"求解,此处省略具体过程。爱丽丝算出一组整数解为 (x,y)=(2753,-15),即 d=2753。


第六步,将n和e封装成公钥,n和d封装成私钥

在爱丽丝的例子中,n=3233,e=17,d=2753,所以公钥就是 (3233,17),私钥就是(3233, 2753)


RSA算法可靠性

回顾上面的密钥生成步骤,一共出现六个数字:

p, q, n, φ(n), e, d

这六个数字之中,公钥用到了两个(n和e),其余四个数字都是不公开的。其中最关键的是d,因为n和d组成了私钥,一旦d泄漏,就等于私钥泄漏。

那么,有无可能在已知n和e的情况下,推导出d?

(1)ed≡1 (mod φ(n))。只有知道e和φ(n),才能算出d。

(2)φ(n)=(p-1)(q-1)。只有知道p和q,才能算出φ(n)。

(3)n=pq。只有将n因数分解,才能算出p和q。

结论:如果n可以被因数分解,d就可以算出,也就意味着私钥被破解。

可是,大整数的因数分解,是一件非常困难的事情。目前,除了暴力破解,还没有发现别的有效方法。维基百科这样写道:

对极大整数做因数分解的难度决定了RSA算法的可靠性。换言之,对一极大整数做因数分解愈困难,RSA算法愈可靠。

假如有人找到一种快速因数分解的算法,那么RSA的可靠性就会极度下降。但找到这样的算法的可能性是非常小的。今天只有短的RSA密钥才可能被暴力破解。
到2008年为止,世界上还没有任何可靠的攻击RSA算法的方式。

只要密钥长度足够长,用RSA加密的信息实际上是不能被解破的。

举例来说,你可以对3233进行因数分解(61×53),但是你没法对下面这个整数进行因数分解。

    2301866845301177551304949
  58384962720772853569595334
  79219732245215172640050726
  36575187452021997864693899
  56474942774063845925192557
  32630345373154826850791702
  61221429134616704292143116
  02221240479274737794080665
  351419597459856902143413

它等于这样两个质数的乘积:

    33478071698956898786044169
  84821269081770479498371376
  85689124313889828837938780
  02287614711652531743087737
  814467999489
    ×
  36746043666799590428244633
  79962795263227915816434308
  76426760322838157396665112
  79233373417143396810270092
  798736308917

加密解密

假设鲍勃要向爱丽丝发送加密信息m,他就要用爱丽丝的公钥 (n,e) 对m进行加密。这里需要注意,m必须是整数(字符串可以取ascii值或unicode值),且m必须小于n。

加密公式: $$m^{e} \equiv c\ (mod\ n)$$

爱丽丝的公钥是 (3233, 17),鲍勃的m假设是65,那么可以算出下面的等式: $$65^{17} \equiv c\ (mod\ 3233)$$

算出 c=2790,鲍勃就把2790发给了爱丽丝。

爱丽丝拿到鲍勃发来的2790以后,就用自己的私钥(3233, 2753) 进行解密。

解密公式: $$c^{d} \equiv m\ (mod\ n)$$

爱丽丝的私钥是 (3233, 2753),鲍勃的加密c是2790,那么可以算出下面的等式: $$2790^{2753} \equiv m\ (mod\ 3233)$$

算出 m=65,爱丽丝知道了鲍勃加密前的原文就是65。

至此,"加密--解密"的整个过程全部完成。


简单案例

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <math.h>
#include <time.h>

//取模反元素 ed ≡ 1 (mod φ(n))
unsigned long
exgcd(unsigned long e, unsigned long x) {
    int d;
    e %= x;
    for(d = 1; d < x; d++) {
        if((e*d) % x == 1) {
            return d;
        }
    }
    return 0;
}

//计算互质数φ(p*q)
unsigned long
totient(unsigned long p, unsigned long q) {
    return (p - 1)*(q - 1);
}

//判断n是否为质数
int
isprime(unsigned long n) {
    unsigned long i;
    for (i = 2; i < n; i++) {
        if (n % i == 0) {
            return 0;
        }
    }
    return 1;
}

//解密
//快速幂取模 in^d mod n
unsigned long int
encrypt(unsigned long long in, unsigned long long n, unsigned long long d) {
    int ans = 1;
    in = in%n;
    while(d > 0) {
        if(d%2 == 1) {
            ans = (ans*in)%n;
        }
        d = d/2;
        in = (in*in)%n;
    }
    return ans;
}

//加密
unsigned long int
decrypt(unsigned long long in, unsigned long long n, unsigned long long d) {
    return encrypt(in, n, d);
}

int
main(int argc, char * * argv) {
    unsigned long p;
    unsigned long q;
    unsigned long e;
    unsigned long x, n, d;
    unsigned long i;

    //随机p
    srand(time(0));
    p = rand() % 16383;
    printf("Using p=%lu\n", p);
    while (!isprime(p)) {
        p++;
    }
    //随机q
    q = rand() % 16383;
    printf("Using q=%lu\n", q);
    while (!isprime(q)) {
        q++;
    }

    n = p*q;
    x = totient(p, q);

    //随机e
    for (i = rand() % x; i < x; i++) {
        if (isprime(i) && x % i != 0) {
            e = i;
            break;
        }
    }

    d = exgcd(e, x);

    printf("p=%lu\tq=%lu\tn=%lu\tx=%lu\td=%lu\te=%lu\n\n", p, q, n, x, d, e);
    printf("Public:  n=%lu\te=%lu\n", n, e);
    printf("Private: n=%lu\td=%lu\n", n, d);
    printf("Testing with value '15'\n");

    unsigned long int enc = 0;
    enc = encrypt(15, n, e);
    printf("Encrypted: %lu\t", enc);

    enc = decrypt(enc, n, d);
    printf("Decrypted: %lu\n", enc);

    return 0;
}

本文主要出自:http://www.ruanyifeng.com/blog/2013/07/rsa_algorithm_part_two.html