高一的时候上VFP课,老师讲解计算机中中文字符占用两个字节。
我向老师提出问题,如果从奇数位置开始截取,会发生什么呢?
因此我在班级中喜提“蟮闹侠”称号。
为什么会出现这种乱码,原理是什么呢?
首先计算机中,一个字节是8位,中文占用两个字节也就是一个汉字16位。
假设“伟大的中国”对应的字节如下:
伟:10001234,43210001
大:10001235,53210001
的:10001236,63210001
中:10001237,73210001
国:10001238,83210001
对应的排序则为:
10001234,43210001 10001235,53210001 10001236,63210001 10001237,73210001 10001238,83210001
那么我只截取4和5两位字符为:
00000000,53210001 10001236,00000000
自动补零,从码表里面找对应的字符,也就是“蟮闹?”,也是常说的乱码了。
打开文件发现乱码了,极大可能是编码格式不匹配。