3.3动态规划--最长公共子序列
阿里云国内75折 回扣 微信号:monov8 |
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6 |
写在前面
定义最优解数组的含义是什么--C[i][j]表示序列X[1:i]和序列Y[1:j]的公共子序列长度左闭右闭区间
递归关系是什么每次添加一个元素进入数组就判断一次他们的最后一个元素是否相同相同的话就可以留下不相同就删除其中一个序列的最后一个元素。
如何构造最优解用一个新的数组b记录尾巴的元素来自上面三种情况的哪一种情况便于还原。
问题描述
定义最长公共子序列为若给定序列X={x1,x2,…,xm}则另一序列Z={z1,z2,…,zk}是X的子序列是指存在一个严格递增下标序列{i1,i2,…,ik}使得对于所有j=1,2,…,k有zj=xij。 给定2个序列X和Y当另一序列Z既是X的子序列又是Y的子序列时称Z是序列X和Y的公共子序列。
例如序列Z={BCDB}是序列X={ABCBDAB}的子序列相应的递增下标序列为{2357}。
最长公共子序列问题给定序列X={x1,x2,…,xm}和Y={y1,y2,…,yn}找出他们的最长公共子序列。
就是说存在一个严格递增下标的序列使得这个序列是另一个序列的子序列。
例如 X={A,B,C,B,D,A,B}
Y={B,D,C,A,B,A}
序列{B,C,B,A}是X和Y的一个子序列长度为4也是最长的公共子序列。
问题分析
最优子结构性质
设序列X={x1,x2,…,xm}和Y={y1,y2,…,yn}的最长公共子序列为Z={z1,z2,…,zk}
(1)若xm=yn则zk=xm=yn且Zk-1是Xm-1和Yn-1的最长公共子序列。
(2)若xm≠yn且zk≠xm则Z是Xm-1和Y的最长公共子序列。
(3)若xm≠yn且zk≠yn则Z是X和Yn-1的最长公共子序列。
由此可知2个序列的最长公共子序列包含了这2个序列的前缀的最长公共子序列。因此最长公共子序列问题具有最优子结构性质。
子问题的递归结构--由最优子结构性质建立子问题最优值的递归关系。
用c[i][j]记录序列和的最长公共子序列的长度。其中 Xi={x1,x2,…,xi}Yj={y1,y2,…,yj}。
当i=0或j=0时空序列是Xi和Yj的最长公共子序列。故此时C[i][j]=0。
其它情况下由最优子结构性质可建立递归关系如下
序列X={x1,x2,…,xi}和Y={y1,y2,…,yj}的最长公共子序列长度计算
(1)若xi=yj则zk=xi=yi最长的长度为序列Xi-1和Yj-1的最长公共子序列长度+1。
(2)若xi≠yj最长的长度在X[1: i-1]或者是Y[1 :j-1]中取得。
(3)如果其中一个是空序列那么最长的公共子序列就是0就像递归的结束条件一样
计算最优值
总共有θ(mn)个不同的子问题因此用动态规划算法自底向上地计算最优值能提高算法的效率。
构造最长公共子序列
空间复杂度的算法的改进--只计算最大长度不需要还原的情况废话
在算法lcsLength和lcs中可进一步将数组b省去。
事实上数组元素c[i][j]的值仅由c[i-1][j-1]c[i-1][j]和c[i][j-1]这3个数组元素的值所确定。
对于给定的数组元素c[i][j]可以不借助于数组b而仅借助于c本身在O(1)时间内确定c[i][j]的值是由c[i-1][j-1]c[i-1][j]和c[i][j-1]中哪一个值所确定的。 如果只需要计算最长公共子序列的长度则算法的空间需求可大大减少。事实上在计算c[i][j]时只用到数组c的第i行和第i-1行。因此用2行的数组空间就可以计算出最长公共子序列的长度。进一步的分析还可将空间需求减至O(min(m,n))。
#include <iostream>
#include <string>
#include <stack>
using namespace std;
void LCS(string s1,string s2)
{
int m=s1.length()+1;
int n=s2.length()+1;
int **c;
int **b;
c=new int* [m];
b=new int* [m];
for(int i=0;i<m;i++)
{
c[i]=new int [n];
b[i]=new int [n];
for(int j=0;j<n;j++)
b[i][j]=0;
}
for(int i=0;i<m;i++)
c[i][0]=0;
for(int i=0;i<n;i++)
c[0][i]=0;
for(int i=0;i<m-1;i++)
{
for(int j=0;j<n-1;j++)
{
if(s1[i]==s2[j])
{
c[i+1][j+1]=c[i][j]+1;
b[i+1][j+1]=1; //1表示箭头为 左上
}
else if(c[i][j+1]>=c[i+1][j])
{
c[i+1][j+1]=c[i][j+1];
b[i+1][j+1]=2; //2表示箭头向 上
}
else
{
c[i+1][j+1]=c[i+1][j];
b[i+1][j+1]=3; //3表示箭头向 左
}
}
}
for(int i=0;i<m;i++) //输出c数组
{
for(int j=0;j<n;j++)
{
cout<<c[i][j]<<' ';
}
cout<<endl;
}
stack<char> same; //存LCS字符
stack<int> same1,same2; //存LCS字符在字符串1和字符串2中对应的下标方便显示出来
for(int i = m-1,j = n-1;i >= 0 && j >= 0; )
{
if(b[i][j] == 1)
{
i--;
j--;
same.push(s1[i]);
same1.push(i);
same2.push(j);
}
else if(b[i][j] == 2)
i--;
else
j--;
}
cout<<s1<<endl; //输出字符串1
for(int i=0;i<m && !same1.empty();i++) //输出字符串1的标记
{
if(i==same1.top())
{
cout<<1;
same1.pop();
}
else
cout<<' ';
}
cout<<endl<<s2<<endl; //输出字符串2
for(int i=0;i<n && !same2.empty();i++) //输出字符串2的标记
{
if(i==same2.top())
{
cout<<1;
same2.pop();
}
else
cout<<' ';
}
cout<<endl<<"最长公共子序列为";
while(!same.empty())
{
cout<<same.top();
same.pop();
}
cout<<endl<<"长度为"<<c[m-1][n-1]<<endl;
for (int i = 0; i<m; i++)
{
delete [] c[i];
delete [] b[i];
}
delete []c;
delete []b;
}
int main()
{
string s1="ABCPDSFJGODIHJOFDIUSHGD";
string s2="OSDIHGKODGHBLKSJBHKAGHI";
LCS(s1,s2);
return 0;
}
代码是我抄的应该自己画一遍数组的表。其余的博客也讲的很清楚了具体过程可以看这个
动态规划解最长公共子序列(LCS)(附详细填表过程)_z-k的博客-CSDN博客_最长公共子序列动态规划算法
得理解那个数组是怎么填的