閭d簺锟斤拷锟斤拷搴勪滑杩囩殑鏄粈涔堟牱瀛愮殑鏃ュ瓙锛? 鏋滄暍鏈?鍚庝竴绔欙紝璁╀笉鏄鐮嶅氨鍚冿拷锟斤拷锟藉惂锛佷笉鎯冲啀閫冮伩浜嗭紝鎴戝氨鏄繖绉嶄汉銆?
贴吧:
鹏寰大厦作者:
刘小夏C 2017-10-02 15:17 【举例详细阐述经典乱码"锟斤拷"的产生】 举例详细说明经典乱码"锟斤拷"。 "锟斤拷"的产生,根本愿意是因为符号的编码方式和解码方式不同,或者转化过程中,有一些符号,用Unicode没法表示造成
贴吧:
魔兽世界作者:
X来自未来主管 2010-08-14 17:58 转贴:冬天刮大白 沙河口家庭装修 15840833844_锟斤拷锟斤拷锟斤... 冬天刮大白 沙河口家庭装修 15840833844_锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷吧_百度贴吧 转自:http://tieba.baidu.com/p/2070414576#0-tieba-1-32394-7ef
贴吧:
大连刮大白作者:
suxiaolei52013 2013-01-13 16:54 回复:【锟斤拷】锑尔号吧锟斤拷专帖 这里解释一下:
鍒板簳浠拷涔堟椂鍊椤紑 锟斤拷锟斤拷 锟斤拷直锟斤拷锟 看到这些字句,您肯定会问,这是什么?这些字句是毫无实际意义的,但它们却形象地表达出了一些莫名其妙的问题。这是一个很经典的乱码。相当经典 最容易出现的地方就是搜索引擎
出现的原因
Unicode和老编码体系的转化过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHARACTER 那么U+FFFD的UTF-8编码出来,恰好是 '\xef\xbf\xbd'。 如果这个'\xef\xbf\xbd',重复多次,例如 '\xef\xbf\xbd\xef\xbf\xbd',然后放到GBK/CP936/GB2312/GB18030的环境中显示的话 一个汉字2个字节,最终的结果就是:锟斤拷 我们上网的时候不用去关心网站采用了什么编码格式,但是页面中不时出现的乱码还是会让我们头疼。在这点上,Firefox的用户更是深有体会,用Firefox浏览网页看到乱码的机会要比IE多得多。 乱码主要与字符编码系统有关。例如一个网页中常出现的乱码“锟斤拷”(百度,Google),它就是新老编码系统转换中出现的。网友est专门写了一篇文章来考证问题来源: Unicode和老编码体系的转化过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHARACTER。那么U+FFFD的UTF-8编码出来,恰好是 '\xef\xbf\xbd'。如果这个'\xef\xbf\xbd',重复多次,例如 '\xef\xbf\xbd\xef\xbf\xbd',然后放到GBK/CP936/GB2312/GB18030的环境中显示的话就是“锟斤拷——锟(0xEFBF),斤(0xBDEF),拷(0xBFBD)”。
最新一次出现
2010年8月14日中午,百度贴吧主页遭到疑似黑客攻击,也有可能是内部维修的错误,因此整个页面一直是锟斤拷等字,并持续大约3-4小时,这也让网友对“锟斤拷”这三个字产生了浓厚的兴趣,甚至出现了以“锟斤拷”为主题的签名档、头像和贴吧。
不要疑惑,我只是个书呆子…………
贴吧:
锑尔号作者:
哆啦梅度六世 2010-08-16 22:25 回复:【锟斤拷】你锟斤拷!就你锟斤拷!你全家都锟斤拷! 编辑词条 锟斤拷 目录 [ 隐藏 ] 出现的原因 最新一次出现 鍒板簳浠�拷涔堟椂鍊椤紑 锟斤拷锟斤拷 锟斤拷直锟斤拷锟 看到这些字句,您肯定会问 ,这是什么?这些字句是毫无实际意义的,但它们却形象地表达出了一些莫名其妙的问题。这是一个很经典的乱码。相当经典 最容易出现的地方就是搜索 引擎[ 编辑本段 ] 出现的原因 Unicode和老编码体系的转化 过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHARACTER 那么U+FFFD的UTF-8编码出来 ,恰好是 '\xef\xbf\xbd'。 如果这个'\xef\xbf\xbd',重复 多次,例如 '\xef\xbf\xbd\xef\xbf\xbd',然后放到GBK/CP936/GB2312/GB18030的环境中显示的话 一个汉字2个字节,最终的结 果就是:锟斤拷 我们上网的时候不用去关心 网站采用了什么编码格式,但是页面中不时出现的乱码还是会让我们头疼。在这点上,Firefox的用户更是深有体会,用Firefox浏览网页看到乱码的机会要比IE多得多。 乱码主要与字符编码系统有关。例如一个网页中常出现的乱码“锟斤拷”(百度,Google),它就是新老编码系统转换中出现的。网友est专门写了一篇文章来考证问题来源: Unicode和老编码体系的转化 过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHARACTER。那么U+FFFD的UTF-8编码出来,恰好是 '\xef\xbf\xbd'。如果这个'\xef\xbf\xbd',重复多次,例如 '\xef\xbf\xbd\xef\xbf\xbd',然后放到GBK/CP936/GB2312/GB18030的环境中显示的话就是“锟斤拷——锟(0xEFBF),斤(0xBDEF),拷(0xBFBD)”。[ 编辑本段 ] 最新一次出现 2010年8月14日中午,百度贴 吧主页遭到疑似黑客攻击,也有可能是内部维修的错误,因此整个页面一直是锟斤拷等字,并持续大约3-4小时,这也让网友对“锟斤拷”这三个字产生了浓厚的兴趣,甚至出现了以“锟斤拷”为主题的签名档、头像和贴吧。
贴吧:
谜之魔盒作者:
澍tion 2010-08-15 17:52 举例详细说明经典乱码"锟斤拷"。【转】 "锟斤拷"的产生,根本愿意是因为符号的编码方式和解码方式不同,或者转化过程中,有一些符号,用Unicode没法表示造成的。 通俗点说,这就好像用密钥A
贴吧:
帝国时代作者:
Mr战士 2010-08-14 22:38 《锟斤拷入侵猫鼠》
贴吧:
猫和老鼠手游作者:
疑惑的牛仔猫 2024-07-11 11:47 回复:【讨论热带云团及数值预报】2024年7月 乱七八糟的集系
描述:破产版锟斤拷锟斤拷?烫烫烫锟斤拷锟斤拷?
贴吧:
台风作者:
Rita????? 2024-07-17 20:15 回复:锟斤拷锟酵o拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷为锟斤拷锟巾 Unicode和老编码体系的转化过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHARACTER
那么U+FFFD的UTF-8编码出来,恰好是 '\xef\xbf\xbd'。
如果这个'\xef\xbf\xbd',重复多次,例如 '\xef\xbf\xbd\xef\xbf\xbd',然后放到GBK/CP936/GB2312/GB18030的环境中显示的话
一个汉字2个字节,最终的结果就是:锟斤拷 哈哈。。。
Python代码:
Java代码
>>> u'\uFFFD'.encode('utf-8')*2
'\xef\xbf\xbd\xef\xbf\xbd'
>>>
>>> print u'\uFFFD'.encode('utf-8')*2
贴吧:
斗破苍穹作者:
纯洁的小飞 2010-08-14 12:49