本文转自网络文章,内容均为非盈利,版权归原作者所有。
转载此文章仅为个人收藏,分享知识,如有侵权,马上删除。

原文作者:QiuJYu
原文地址:密码学基础:Base64编码

目录

文章概述:

Base64简介:

Base64的编码原理:

Base64的编码图解:

Base64核心代码讲解(C语言):

Base64加密部分:

Base64解密部分:

本篇总结:

代码实现


文章概述:

  • 本文目的:写这篇文章的目的主要是整理下密码学中Base64的知识点,并把它们分享出来。并且帮助初探密码学的坛友们一步一步的用C语言将Base64的编码实现出来。
  • 阅读方法:希望大家在浏览完本片文章后可以自己去实现一下,相信一定会对你的编程技术有所提高。(附件中提供参考代码)
  • 具备基础:
    (1)熟练掌握C语言
  • 学习环境:任意C语言开发环境, Base64加解密工具

Base64简介:

  虽然这篇文章发布在密码算法区,但希望大家不要误解,Base64并不是一种加密的方法,而是一种编码的方式。虽然用Base64加密(暂且说是加密)的字符串看起来有一种被加密的感觉,但是这只是感觉。因为如果用标准的Base64进行加密会发现很多Base64的特征,比如在Base64字符串中会出现'+'和'\'两种字符,在字符串的末尾经常会有一个到两个连续的'='。只要发现了这些特征,就可以肯定这个字符串被Base64加密过,只要通过相应的解密小程序就可以轻松得到加密前的样子(非标准的除外)。
  那么有为什么说Base64是一中编码方式呢?这是因为Base64可以把所有的二进制数据都转换成ASCII码可打印字符串的形式。以便在只支持文本的环境中也能够顺利地传输二进制数据。当然有时在CTF的题目中掺杂上非标准的Base64编码表也会有加密的效果,但是如果找到这个表那就编程明文了,所以在CTF题目中只会起到辅助的作用。

Base64的编码原理:

  Base64编码的核心原理是将二进制数据进行分组,每24Bit(3字节)为一个大组,再把一个大组的数据分成4个6Bit的小分组。由于6Bit数据只能表示64个不同的字符(2^6=64),所以这也是Base64的名字由来。这64个字符分别对应ASCII码表中的'A'-'Z','a'-'z','0''9','+'和'/'。他们的对应关系是由Base64字符集决定的。因为小分组中的6Bit数据表示起来并不方便,所以要把每个小分组进行高位补零操作,这样每个小分组就构成了一个8Bit(字节)的数据。在补零操作完成后接下来的工作就简单多了,那就是将小分组的内容作为Base64字符集的下标,然后一一替换成对应的ASCII字符。加密工作完成。

  Base64解密的工作原理也非常的简单,只要操作方式和加密步骤相反即可。首先将Base64编码根据其对应的字符集转换成下标,这就是补完零后的8Bit(一字节)数据。既然有补零操作那自然会有去零操作了,我们要将这些8Bit数据的最高位上的两个0抹去形成6Bit数据,这也就是前面我们提到过的小分组。最后就是将每4个6Bit数据进行合并形成24Bit的大分组,然后将这些大分组按照每组8Bit进行拆分就会得到3个8Bit的数据,这写8Bit数据就是加密前的数据了。解密工作完成。

  重点:别看前面说的Base64工作流程这么简单,实际上里面还是有很多坑的,那在我们了解了编码原理后现在就来填坑了:
  我们在Base64编码前是无法保证准备编码的字符串长度是3的倍数,所以为了让编码能够顺利进行就必须在获取编码字符串的同时判断字符串的长度是否是3的倍数,如果是3的倍数编码就可以正常进行,如果不是那么就要进行额外的操作——补零,就是要在不足3的倍数的字符串末尾用0x00进行填充。
  这样就是解决了字符串长度不足的问题了,但是同时也引进了另一个新的问题,那就是末尾补充上的0在进行Base64字符集替换的时候会与字符集中的'A'字符发生冲突。因为字符集中的下标0对应的字符是'A',而末尾填充上的0x00在分组补零后同样是下标0x00,这样就无法分辨出到底是末尾填充的0x00还是二进制数据中的0x00。为了解决这个问题我们就必须引入Base64字符集外的新字符来区分末尾补充上的0x00,这就是'='字符不在Base64字符集中,但是也出现在Base64编码的原因了,'='字符在一个Base64编码的末尾中最多会出现两个,如果不符合这以规则那么这个Base64就可能被人做了手脚。

Base64字符集:

Base64的编码图解:

我们以输入字符串"6666"为例:  

1、判断字符串长度,不足3的倍数用0x00填充:

2、将补零后的字符串进行8Bit分组:

3、把每个大分组进行6Bit分组:

4、将6Bit组转换成Base64字符集的下标:
(注:由于是进行图片解说,所以省区了6Bit组高位补零操作!)

5、把字符集的下标替换成Base64字符:

6、修正末尾的符号,得到Base64编码结果

解密操作和加密操作相反!

Base64核心代码讲解(C语言):

Base64加密部分:

1、将长度补全后的字符串转换成6Bit分组:

int TransitionSixBitGroup(unsigned char *BitPlainText, unsigned char* SixBitGroup, unsigned int SixBitGroupSize)
{int ret = 0;//1、每4个6Bit组一个循环for (int i = 0, j = 0; i < SixBitGroupSize; i += 4, j += 3){SixBitGroup[i]        = ((BitPlainText[j] & 0xFC) >> 2);SixBitGroup[i + 1]    = ((BitPlainText[j] & 0x03) << 4) + ((BitPlainText[j + 1] & 0xF0) >> 4);SixBitGroup[i + 2]    = ((BitPlainText[j + 1] & 0x0F) << 2) + ((BitPlainText[j + 2] & 0xC0) >> 6);SixBitGroup[i + 3]    = (BitPlainText[j + 2] & 0x3F);}return ret;
}

  这一段代码的功能是将已经补足长度的16进制数据转变成6Bit分组,每一个分组用8Bit(一个字节)表示,所以也就自动完成了6Bit组的高位补零操作。这里用到了一个for循环,其目的是为了达到前面所说的分组,这里分了两个部分,一部分是将16进制数据分成一个3*8Bit的大分组,另一部分是将大分组中的数据分割成4*6Bit的小分组,分割的过程用到了很多位操作,大大降低了分组的复杂性,只不过需要注意运算法的优先级。
  语句剖析:
  SixBitGroup[i] = ((BitPlainText[j] & 0xFC) >> 2); //在3*8Bit数据中的第一个数据取6Bit内容右移两位得到第一个6Bit数据。

  SixBitGroup[i + 1] = ((BitPlainText[j] & 0x03) << 4) + ((BitPlainText[j + 1] & 0xF0) >> 4);//在3*8Bit数据中的第一个数据取2Bit内容后左移4位,加上3*8Bit数据中的第二个数据取4Bit数据构成第二个6Bit数据。

  SixBitGroup[i + 2] = ((BitPlainText[j + 1] & 0x0F) << 2) + ((BitPlainText[j + 2] & 0xC0) >> 6);//在3*8Bit数据中的第二个数据取4Bit内容后左移2位,加上3*8Bit数据中的第三个数据取2Bit数据右移6位构成第三个6Bit数据。

  SixBitGroup[i + 3] = (BitPlainText[j + 2] & 0x3F);//在3*8Bit数据中的第三个数据取6Bit数据得到最后一个6Bit数据。

2、根据6Bit组获取字符串:

unsigned char Base64Table[64] =
{'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H','I', 'G', 'K', 'L', 'M', 'N', 'O', 'P','Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X','Y', 'Z', 'a', 'b', 'c', 'd', 'e', 'f','g', 'h', 'i', 'j', 'k', 'l', 'm', 'n','o', 'p', 'q', 'r', 's', 't', 'u', 'v','w', 'x', 'y', 'z', '0', '1', '2', '3','4', '5', '6', '7', '8', '9', '+', '/'
};int GetBase64String(unsigned char *CipherGroup, unsigned char *SixBitGroup, unsigned int SixBitGroupSize)
{int ret = 0;for (int i = 0; i < SixBitGroupSize; i++){CipherGroup[i] = Base64Table[SixBitGroup[i]];}return ret;
}

  通过第一步的处理,我们得到了Base64的高位补零后的6Bit分组也就是Base64字符集的下标。通过下标获取Base64字符集中的内容也就非常简单了,利用for循环进行查表赋值操作就可以初步得到Base64的编码值了。

3、将初步得到Base64的编码值末尾补充的字符转换成'=':

unsigned int            NumberOfEqual;          //填充后等号最大个数  //填充一个字节的最多会产生一个 '=', 填充两个字节的最多会产生两个 '='
if (strlen(PlainText) % 3)    //不是3的倍数
{NumberOfEqual       = 3 - (strlen(PlainText) % 3);
}
else    //是3的倍数
{NumberOfEqual       = 0;
}for (int i = SixBitGroupSize - 1; i >= SixBitGroupSize - NumberOfEqual; i--)
{if (CipherGroup[i] == 'A'){CipherGroup[i] = '=';}
}

  因为填充一个字节的最多会产生一个 '=', 填充两个字节的最多会产生两个 '=',所以判断条件为i > SixBitGroupSize-NumberOfEqual,并且在循环中判断末尾是否是补充字符。经过这一过程,也就获取了Base64加密后的结果。加密完成!

Base64解密部分:

1、将Base64密文转换成Base64下标:

int GetBase64Index(unsigned char *CipherText, unsigned char *Base64Index, unsigned int Base64IndexSize)
{int ret = 0;for (int i = 0; i < Base64IndexSize; i++){//计算下标if (CipherText[i] >= 'A' && CipherText[i] <= 'Z')    //'A'-'Z'{Base64Index[i] = CipherText[i] - 'A';}else if (CipherText[i] >= 'a' && CipherText[i] <= 'z')    //'a'-'z'{Base64Index[i] = CipherText[i] - 'a' + 26;}else if (CipherText[i] >= '0' && CipherText[i] <= '9')    //'0'-'9'{Base64Index[i] = CipherText[i] - '0' + 52;}else if (CipherText[i] == '+'){Base64Index[i] = 62;}else if (CipherText[i] == '/'){Base64Index[i] = 63;}else    //处理字符串末尾是'='的情况{Base64Index[i] = 0;}}return ret;
}

  由于Base64字符串是用ASCII码表示的,所以要想获取其对应的索引号就需要减去每一段ASCII第一个字符后加上相应的偏移,最后应该注意的是不要忘记还有一个不在Base64字符集的字符。

2、将Base64下标(6Bit组)转换为明文字符串的8Bit组形式

int TransitionEightBitGroup(unsigned char *BitPlainText, unsigned char *Base64Index, unsigned int Base64IndexSize)
{int ret = 0;for (int i = 0, j = 0; j < Base64IndexSize; i += 3, j += 4){BitPlainText[i]        = (Base64Index[j] << 2) + ((Base64Index[j + 1] & 0xF0) >> 4);BitPlainText[i + 1]    = ((Base64Index[j + 1] & 0x0F) << 4) + ((Base64Index[j + 2] & 0xFC) >> 2);BitPlainText[i + 2]    = ((Base64Index[j + 2] & 0x03) << 6) + Base64Index[j + 3];}
Freturn ret;
}

  这里进行的位操作有点不容易理解,但是它的作用就是把4*6Bit组中高位填充的0x00去掉后合并成3*8Bit的明文数据。需要留心下位操作的运算符优先级和处理的数据位。最后得到的结果就是16进制数据了。解密完成!
  语句剖析:
  BitPlainText[i] = (Base64Index[j] << 2) + ((Base64Index[j + 1] & 0xF0) >> 4);//将第一个4*6Bit组数据左移2位去除高位补的0x00得到6个有效Bit位,从第二个4*6Bit组取得4Bit数据右移4位(包含两个有效位),两个部分相加得到第一个3*8Bit组数据。

  BitPlainText[i + 1] = ((Base64Index[j + 1] & 0x0F) << 4) + ((Base64Index[j + 2] & 0x3C) >> 2);//从第二个4*6Bit组取得4Bit数据左移4位得到4个有效Bit位,从第三个4*6Bit组取得6Bit数据右移2位得到4个有效Bit位,两个部分相加得到第二个3*8Bit组数据。

  BitPlainText[i + 2] = ((Base64Index[j + 2] & 0x03) << 6) + Base64Index[j + 3];//从第三个4*6Bit组取得2Bit数据左移6位得到2个有效Bit位,从第四个4*6Bit组取得8Bit数据得到6个有效Bit位,两个部分相加得到第三个3*8Bit组数据。

本篇总结:

  写到这里,我对Base64算法的理解也就分享完了。其实Base64的原理非常简单,但是实现它的过程却十分的有意思,它展现了C语言中位操作的魅力。我感觉只有对位操作有着深入的理解,才能更好的进行密码学的学习。

代码实现

实现代码,请查看

不知道是为什么在核心代码讲解部分,完全不知道要写些什么。。。。

密码算法原理与实现:Base64编码相关推荐

  1. openssl算法 —— 利用openssl进行BASE64编码解码、md5/sha1摘要、AES/DES3加密解密

    openssl 加密字符串的方法: 一.利用openssl命令进行BASE64编码解码(base64 encode/decode): 1. BASE64编码命令 对字符串'abc'进行base64编码 ...

  2. 安全密码c语言编程,商用密码算法原理与C语言实现

    2020年1月1日,<中华人民共和国密码法>正式施行.国家鼓励和支持密码科学技术研究与应用,促进密码科学技术进步与创新,加强密码人才培养和队伍建设,采取多种形式加强密码安全教育.本书是在国 ...

  3. 密码算法原理与分析:RSA安全与秘钥基础设施

    本文转自网络文章,内容均为非盈利,版权归原作者所有. 转载此文章仅为个人收藏,分享知识,如有侵权,马上删除. 原文作者:evilpan 原文地址:RSA安全与秘钥基础设施 目录 前言 RSA原理 秘钥 ...

  4. base64编码 springboot_Spring Boot 中如何实现 HTTP 认证?

    松哥给最近连载的 Spring Security 系列也录制了视频教程,感兴趣的小伙伴请戳这里->Spring Boot+Vue+微人事视频教程(Spring Boot 第十章就是 Spring ...

  5. Java、JS、OC、Flutter的Base64编码和解码

    题记 -- 执剑天涯,从你的点滴积累开始,所及之处,必精益求精,即是折腾每一天. ** 你可能需要 CSDN 网易云课堂教程 掘金 EDU学院教程 知乎 Flutter系列文章 本文章将描述在 Jav ...

  6. Base64编码解码小脚本

    目录 脚本 Base64简介 Base64编码原理 Python应用base64编码和解码 Python File(文件) 方法 open()方法 file对象 with as Python对文件后缀 ...

  7. 密码学:c/c 语言实现 pdf,典型密码算法C语言实现pdf

    典型密码算法C语言实现 内容简介 <典型密码算法C语言实现>详细讲述了一些典型密码算法的算法原理及C语言实现.书中密码算法包括:序列密码.分组密码.公钥密码和Hash算法,其中序列密码有祖 ...

  8. 杨元原博士国密课堂 · 第二期 | 商用密码应用安全性评估:Part2. 商用密码算法

    #国密课堂#   第二期 商用密码应用 安全性评估 Part 2. 商用密码算法 在第一期国密课堂 中,杨博士带大家简单了解了密码算法的概念.第二期杨博士带我们继续走近商用密码应用安全性评估领域,进一 ...

  9. Base64 算法原理,以及编码、解码【加密、解密】 介绍

    Base64编码,是我们程序开发中经常使用到的编码方法.它是一种基于用64个可打印字符来表示二进制数据的表示方法.它通常用作存储.传输一些二进制数据编码方法!也是MIME(多用途互联网邮件扩展,主要用 ...

最新文章

  1. Jenkins 持续集成 概念(学习笔记二十六)
  2. luvit 被忽视的lua 高性能框架(仿nodejs)
  3. 翻译神器拓宽语言沟通边界传神TransnBox、T1惊艳中国企业互联网CEO 峰会
  4. 记事本贪吃蛇游戏代码_厉害了,程序员28行代码写贪吃蛇游戏,附源码!
  5. Java编写代理服务器(Burp拦截Demo)一
  6. 加速国内 Github 访问,下载的9种方案!
  7. Linux : DHCP 服务
  8. php中new与构造函数,php - 在构造函数中使用“ new”关键字 - SO中文参考 - www.soinside.com...
  9. 【linux】常用命令总结
  10. Unity Shader _Time 的单位
  11. 如何通过“随航”将iPad用作苹果Mac的第二个显示屏?
  12. Apache部署多个WordPress网站
  13. java mysql 博客园_JAVA基础--MySQL
  14. 如何选择机器人的电机
  15. Microsoft store下载速度过慢
  16. 怎么查看html隐藏代码,隐藏HTML源代码 怎样查看网页中隐藏的html源码
  17. 爬取新浪滚动新闻--每个详情页标题以及内容
  18. 如何玩好“用户思维”
  19. SEO优化:什么是SEO链轮?站群与博客群的优劣比较!
  20. TTN服务器LoRaWAN网关配置流程

热门文章

  1. 算法-概率论(基本概念、古典概型、几何概型)
  2. UVC分析——基于UVC的罗技摄像头C270 hack
  3. 自定义view 落叶效果
  4. jpa基于ExampleMatcher,Example实现动态筛选,模糊查询,分页,排序,时间范围筛选
  5. 四元数,对偶四元数,三维旋转,平移
  6. 解决fatal: unable to access ‘https://github.com/NVIDIA/apex.git/‘: Recv failure: Connection was reset
  7. UESTC 764 失落的圣诞节 直接or线段树orRMQ
  8. 数据结构与算法分析之---部分排序算法的实现
  9. 好丽友“好运屋”亮相冰雪大世界,集福气新年“友”好运
  10. 【音频篇】Unity中使用wwise的常见问题及解决方案