壓縮技術主要的工作方式就是找到重復的模式,進行緊密的編碼。
BWT(Burrows–Wheeler_transform)將原來的文本轉(zhuǎn)換為一個相似的文本,轉(zhuǎn)換后使得相同的字符位置連續(xù)或者相鄰;
之后可以使用其他技術如:Move-to-front transform 和 游程編碼(RLE) 進行文本壓縮。
一般壓縮可以將文本先使用Burrows–Wheeler transform生成局部相關性很好的序列,再使用MTF減少信息熵,最后再進行壓縮。
Burrows–Wheeler transform + Run-length coding
延伸閱讀
學習是年輕人改變自己的最好方式