脱氧核糖核酸即常说的DNA,是一类带有遗传信息的生物大分子。它由4种主要的脱氧核苷酸(dAMP、dGMP、dCMT和dTMP)通过磷酸二酯键连接而成。这4种核苷酸可以分别记为:A、G、C、T。
DNA携带的遗传信息可以用形如:AGGTCGACTCCA.... 的串来表示。DNA在转录复制的过程中可能会发生随机的偏差,这才最终造就了生物的多样性。
    为了简化问题,我们假设,DNA在复制的时候可能出现的偏差是(理论上,对每个碱基被复制时,都可能出现偏差):
 1. 漏掉某个脱氧核苷酸。例如把 AGGT 复制成为:AGT
    2. 错码,例如把 AGGT 复制成了:AGCT
    3. 重码,例如把 AGGT 复制成了:AAGGT
    如果某DNA串a,最少要经过 n 次出错,才能变为DNA串b,则称这两个DNA串的距离为 n。
    例如:AGGTCATATTCC 与 CGGTCATATTC 的距离为 2
    你的任务是:编写程序,找到两个DNA串的距离。
【输入、输出格式要求】
    用户先输入整数n(n<100),表示接下来有2n行数据。
    接下来输入的2n行每2行表示一组要比对的DNA。(每行数据长度<10000)
    程序则输出n行,表示这n组DNA的距离。
    例如:用户输入:
3
AGCTAAGGCCTT
AGCTAAGGCCT
AGCTAAGGCCTT
AGGCTAAGGCCTT
AGCTAAGGCCTT
AGCTTAAGGCTT
则程序应输出:
1
1
2
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
思路:刚开始做的时候没啥思路,网上看了一个博客之后突然发现和求最长公共序列很相似,顿时感觉自己脑子锈掉了,之前写过类似的题啊,具体的思路过程为
与其说是DNA比对,不如说是字符串比对,用户输入两个字符串str1和str2,我们把str1作为标准串,由str2变为标准串可以通过重复,丢失和修改三种方法。
重复就是str1[i]=A , str1[i+1]=C , str[i+2]=T ,而对应的str2[i]=A ,str2[i+1] = A ,str2[i+2]=C
丢失就是str1[i]=A , str1[i+1]=C , str[i+2]=T ,而对应的str2[i]=A ,str2[i+1] = T
修改就是str1[i]=A , str1[i+1]=C , str[i+2]=T ,而对应的str2[i]=A ,str2[i+1] = G,str2[i+2]=T
我们假设str1的长度为len1,str2的长度为len2,用数组dp[len1][len2]表示str2变化为str1最少需要几步,也就是我们最后的答案。
我们把这个问题细化,假设dp[i][j]表示str2的字串str1[0]~str1[i-1]变成str1的字串str2[0]~str2[j-1]最少需要的步数
那么对于dp[i][j]可能有两种情况:
str1[i] == str2[j] ,这个时候,dp[i][j] = dp[i-1][j-1]
str1[i] != str2[j] ,这个时候,分为三种情况:
重复的情况:dp[i][j] = dp[i][j-1] +1
ACT
ACTT
dp[3][4] = dp[3][3] +1,因为此时str2的子串比str1的子串多出了一个字符,所以让j回到多出的那个字符前面再进行比较,得到dp[i][j-1]然后在进行了一步重复操作,所以+1
丢失的情况:dp[i][j] = dp[i-1][j] +1
ACTT
ACT
dp[4][3] = dp[3][3] +1 ,因为此时str2的子串比str1的子串丢失了一个字符,所以让i回到丢失的那个字符的前面在进行比较,得到dp[i-1][j]然后再进行一步丢失操作,所以+1
修改的情况:dp[i][j] = dp[i-1][j-1]+1
ACT
AGT
dp[3][3] = dp[2][2]
dp[2][2] = dp[1][1]+1,因为此时str1的子串和str2的长度相同,但是字符不一样,所以i-1,j-1回到上一个状态,然后再+1。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
代码的实现是用的比较常规的一类动态规划题的解法,具体可参考我之前写的最长公共子序列:https://www.cnblogs.com/henuliulei/p/10074366.html
 1 #include<bits/stdc++.h>
 2
 3 using namespace std;
 4 int f(string str1,string str2)
 5 {
 6     int Len1=str1.length();
 7     int Len2=str2.length();
 8     int dp[Len1+1][Len2+1];
 9     memset(dp,0,sizeof(dp));
10     for(int i=0;i<=Len1;i++){
11         dp[i][0]=i;
12     }
13     for(int j=0;j<=Len2;j++){
14         dp[0][j]=j;
15     }
16     for(int i=1;i<=Len1;i++){
17         for(int j=1;j<=Len2;j++){
18             if(str1[i-1]==str2[j-1]){
19                 dp[i][j]=dp[i-1][j-1];////对应字母相等,array值不增加
20             }else{
21                 //三个形参分别对应str2在str1的基础上增加,减少和修改的情况
22                 int a=min(dp[i-1][j]+1,dp[i][j-1]+1);
23                 dp[i][j]=min(a,dp[i-1][j-1]+1);
24             }
25         }
26     }
27
28
29     return dp[Len1][Len2];
30 }
31 int main()
32 {
33     freopen("D:/Test/Test1.txt","r",stdin);
34     int n;
35     cin >> n;
36     int p=n;
37     int array[n];
38     memset(array,0,sizeof(array));
39     int num=0;
40     while(n--){
41         string str1,str2;
42         cin >> str1 >> str2;
43
44         array[num++]=f(str1,str2);
45     }
46     for(int i=0;i<p;i++){
47         cout << array[i] << endl;
48     }
49     return 0;
50  } 

reference:https://blog.csdn.net/qsyzb/article/details/27372073

转载于:https://www.cnblogs.com/henuliulei/p/10805919.html

历届试题_DNA比对相关推荐

  1. 算法笔记_183:历届试题 九宫重排(Java)

    目录 1 问题描述 2 解决方案   1 问题描述 问题描述 如下面第一个图的九宫格中,放着 1~8 的数字卡片,还有一个格子空着.与空格子相邻的格子中的卡片可以移动到空格中.经过若干次移动,可以形成 ...

  2. 【蓝桥杯】历届试题 地宫取宝

     历届试题 地宫取宝 时间限制:1.0s   内存限制:256.0MB      问题描述 X 国王有一个地宫宝库.是 n x m 个格子的矩阵.每个格子放一件宝贝.每个宝贝贴着价值标签. 地宫的入口 ...

  3. 历届试题 买不到的数目

    历届试题 买不到的数目   时间限制:1.0s   内存限制:256.0MB 问题描述 小明开了一家糖果店.他别出心裁:把水果糖包成4颗一包和7颗一包的两种.糖果不能拆包卖. 小朋友来买糖的时候,他就 ...

  4. java 核桃的数量,[Java教程]【蓝桥杯】历届试题 核桃的数量

    [Java教程][蓝桥杯]历届试题 核桃的数量 0 2016-03-31 23:33:50 历届试题 核桃的数量 时间限制:1.0s   内存限制:256.0MB问题描述 小张是软件项目经理,他带领3 ...

  5. 试题 历届试题 包子凑数(dp)

    试题 历届试题 包子凑数 资源限制 时间限制:1.0s 内存限制:256.0MB 0x00 问题描述 小明几乎每天早晨都会在一家包子铺吃早餐.他发现这家包子铺有N种蒸笼,其中第i种蒸笼恰好能放Ai个包 ...

  6. 试题 历届试题 幸运数(二分)

    试题 历届试题 幸运数 资源限制 时间限制:1.0s 内存限制:256.0MB 题描述 幸运数是波兰数学家乌拉姆命名的.它采用与生成素数类似的"筛法"生成 . 首先从1开始写出自然 ...

  7. 试题 历届试题 翻硬币(贪心)

    试题 历届试题 翻硬币 资源限制 时间限制:1.0s 内存限制:256.0MB Work hard,Play harder. 问题描述 小明正在玩一个"翻硬币"的游戏. 桌上放着排 ...

  8. 试题 历届试题 买不到的数目(dp/数学)

    试题 历届试题 买不到的数目 资源限制 时间限制:1.0s 内存限制:256.0MB $Daily English 曾几何时,我流连梦境,心比天高,人生充满希望. I dreamed a dream ...

  9. 历届试题 打印十字图(模拟)

    试题 历届试题 打印十字图 资源限制 时间限制:1.0s 内存限制:256.0MB $Daily English: 我想要提醒这个星球上的人类唯一的一件事就是:我们 依赖地球母亲生存. The onl ...

最新文章

  1. 我非要捅穿这 Neutron(二)上层资源模型篇
  2. windows 下编译 jrtplib-3.9.1 和 jthread-1.3.1
  3. 牛客网--牛牛找工作
  4. 漫步最优化六——数学规划
  5. 安全编码最佳实践:PHP及编程语言安全
  6. 从Preact了解一个类React的框架是怎么实现的(二): 元素diff
  7. 翻译:TRUNCATE TABLE(已提交到MariaDB官方手册)
  8. ssas 分层维度_通过SSAS维度层次结构增强数据分析
  9. Clojure的并发(七)pmap、pvalues和pcalls
  10. python函数的面向对象——面向对象设计
  11. bzoj 1415: [Noi2005]聪聪和可可
  12. 给Eclipse中hibernate.cfg.xml配置文件加提示
  13. spurious wakeup -- 多线程之虚假唤醒
  14. python判断身份证号码是否合法_怎样使用 Python 判断身份证号码是否正确-阿里云开发者社区...
  15. win10文件资源管理器默认打开我的电脑及左侧导航设置
  16. Rundll32.exe 转自5iuu.com
  17. openpyxl,给单元格插入公式,求和通过excel公式实现
  18. 今日恐慌与贪婪指数为21 恐慌程度有所缓解
  19. android简单视频播放器,推荐用于Android超简单视频播放器的ArtPlayer
  20. cheng-06、初始化失败_Destroying singletons报错问题

热门文章

  1. FreeRTOS学习记录 01--中断管理
  2. 【转】下载量最高的 100 个 Laravel 扩展包推荐
  3. android 录音
  4. 细数Ubutu18.04上安装wine版微信(2.6.8)遇到的坑
  5. 【HDL系列】乘法器(6)——Radix-4 Booth乘法器
  6. ABIDE(自闭症)数据集(nii格式)下载
  7. 百度搜索优化:去除广告和热搜
  8. 跨境电商多平台运营库存管理难 选对erp软件很重要
  9. 弘辽 科技:如何提高宝贝的转化率。
  10. mbot机器人初体验_[首发开箱]Makeblock mBot Ranger mBot游侠版 强大的STEM教育机器人...