clear;clc;
L=input('please input a string:'); %提示輸入界面
n1=length(L);
L2=L(1); i=2;
while i<=n1
ifstrfind(L2,L(i))
i=i+1;
else
L2=strcat(L2,L(i));
i=i+1;
end
end
n=length(L2);
for i=1:n
N(i)=length(find(L==L2(i)));
end
for i=1:n
p(i)=N(i)./n1;
end
q=p;
a=zeros(n-1,n); %生成一個(gè)n-1 行n 列的數(shù)組
for i=1:n-1
[q,l]=sort(q); %對(duì)概率數(shù)組q 進(jìn)行從小至大的排序,并且用l 數(shù)組返回一個(gè)數(shù)組,該數(shù)組表示概率數(shù)組q排序前的順序編號(hào)
a(i,:)=[l(1:n-i+1),zeros(1,i-1)]; %由數(shù)組l構(gòu)建一個(gè)矩陣,該矩陣表明概率合并時(shí)的順序,用于后面的編碼
q=[q(1)+q(2),q(3:n),1]; %將排序后的概率數(shù)組q的前兩項(xiàng),即概率最小的兩個(gè)數(shù)加和,得到新的一組概率序列
end
for i=1:n-1
c(i,1:n*n)=blanks(n*n); %生成一個(gè)n-1 行n 列,并且每個(gè)元素的的長(zhǎng)度為n 的空白數(shù)組,c矩陣用于進(jìn)行huffman 編碼,并且在編碼中與a 矩陣有一定的對(duì)應(yīng)關(guān)系
end
c(n-1,n)='0'; %由于a 矩陣的第n-1 行的前兩個(gè)元素為進(jìn)行huffman 編碼加和運(yùn)算時(shí)所得的最
c(n-1,2*n)='1'; %后兩個(gè)概率,因此其值為0 或1,在編碼時(shí)設(shè)第n-1行的第一個(gè)空白字符為0,第二個(gè)空白字符1。
for i=2:n-1
c(n-i,1:n-1)=c(n-i+1,n*(find(a(n-i+1,:)==1))-(n-2):n*(find(a(n-i+1,:)==1)));%矩陣c 的第n-i 的第一個(gè)元素的n-1 的字符賦值為對(duì)應(yīng)于a 矩陣中第n-i+1 行中值為1 的位置在c矩陣中的編碼值
c(n-i,n)='0'; %根據(jù)之前的規(guī)則,在分支的第一個(gè)元素最后補(bǔ)0
c(n-i,n+1:2*n-1)=c(n-i,1:n-1); %矩陣c 的第n-i 的第二個(gè)元素的n-1 的字符與第n-i行的第一個(gè)元素的前n-1 個(gè)符號(hào)相同,因?yàn)槠涓?jié)點(diǎn)相同
c(n-i,2*n)='1'; %根據(jù)之前的規(guī)則,在分支的第一個(gè)元素最后補(bǔ)1
for j=1:i-1
c(n-i,(j+1)*n+1:(j+2)*n)=c(n-i+1,n*(find(a(n-i+1,:)==j+1)-1)+1:n*find(a(n-i+1,:)==j+1));
%矩陣c 中第n-i 行第j+1 列的值等于對(duì)應(yīng)于a 矩陣中第n-i+1 行中值為j+1 的前面一個(gè)元素的位置在c矩陣中的編碼值
end
end %完成huffman 碼字的分配
for i=1:n
h(i,1:n)=c(1,n*(find(a(1,:)==i)-1)+1:find(a(1,:)==i)*n); %用h表示最后的huffman 編碼,矩陣h的第i 行的元素對(duì)應(yīng)于矩陣c 的第一行的第i 個(gè)元素
ll(i)=length(find(abs(h(i,:))~=32)); %計(jì)算每一個(gè)huffman 編碼的長(zhǎng)度
end
disp('二元霍夫曼編碼平均碼長(zhǎng)')
l=sum(p.*ll); %計(jì)算平均碼長(zhǎng)
%fprintf('n huffman code:n');
h
disp('信源熵')
hh=sum(p.*(-log2(p))) %計(jì)算信源熵
%fprintf('n the huffman effciency:n');
disp('編碼效率')
t=hh/l %計(jì)算編碼效率
愛(ài)華網(wǎng)本文地址 » http://www.klfzs.com/a/25101015/242203.html
愛(ài)華網(wǎng)

