zeroieme
千年狐狸
千年狐狸
  • UID12805
  • 注册日期2006-05-17
  • 最后登录2015-10-11
  • 发帖数1407
  • 经验34枚
  • 威望0点
  • 贡献值20点
  • 好评度0点
  • 社区居民
阅读:4213回复:14

求高手制作修补中文网页的扩展

楼主#
更多 发布于:2006-05-18 17:58
由于中文为双字节或3字节(UTF-8)编码,偶有些网页因为缺了1个字节引起一串乱码,如:
舜寺衣胛票嗉魈匾庵圃
通常我是保存网页后用WinHex修改。求高手制作一扩展,可以直接在firefox上补上1个字节。
zeroieme
千年狐狸
千年狐狸
  • UID12805
  • 注册日期2006-05-17
  • 最后登录2015-10-11
  • 发帖数1407
  • 经验34枚
  • 威望0点
  • 贡献值20点
  • 好评度0点
  • 社区居民
1楼#
发布于:2006-05-18 17:58
顶上
等待高手
 
zeroieme
千年狐狸
千年狐狸
  • UID12805
  • 注册日期2006-05-17
  • 最后登录2015-10-11
  • 发帖数1407
  • 经验34枚
  • 威望0点
  • 贡献值20点
  • 好评度0点
  • 社区居民
2楼#
发布于:2006-05-18 17:58
继续等
xincentre
非常火狐
非常火狐
  • UID12562
  • 注册日期2006-05-02
  • 最后登录2022-06-19
  • 发帖数705
  • 经验15枚
  • 威望0点
  • 贡献值4点
  • 好评度0点
  • 社区居民
3楼#
发布于:2006-05-18 17:58
这个问题太高深了……WinHex是啥子东东?

俺反正遇见乱码就在查看-字符编码里的一大堆编码中一个一个试,总有一个能显示正常的
zeroieme
千年狐狸
千年狐狸
  • UID12805
  • 注册日期2006-05-17
  • 最后登录2015-10-11
  • 发帖数1407
  • 经验34枚
  • 威望0点
  • 贡献值20点
  • 好评度0点
  • 社区居民
4楼#
发布于:2006-05-18 17:58
这不是字符编码不对,是字符错位了

WinHEX 是一个十六进制编辑器
比如 “一段文字”的编码是
%D2%BB %B6%CE %CE%C4 %D7%D6
“一”字要是少了%D2,电脑会把后面按
%BB%B6 %CE%CE %C4%D7 %D6
组合显示,一般文字编辑软件还改不了
用十六进制编辑器在%BB后查入一个%20成
%BB%20 %B6%CE %CE%C4 %D7%D6
就正常了,
taizitju
千年狐狸
千年狐狸
  • UID10093
  • 注册日期2005-11-27
  • 最后登录2012-04-12
  • 发帖数3638
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
5楼#
发布于:2006-05-18 17:58
好像早年间有人论证过
完全的智能破乱码 是不可能的
[color=orange][b]为新手服务[/b][/color]  [color=BLUE][b]快速解决问题传送门:[/b][/color][url=https://www.firefox.net.cn/newforum/viewtopic.php?t=22571][color=red][b]①Firefox初级教程(置顶帖)[/b][/color][/url]  [url=https://www.firefox.net.cn/newforum/viewtopic.php?t=27478][color=red][b]②孟婆汤(清空profile工具)[/b][/color][/url]  [url=https://www.firefox.net.cn/newforum/viewtopic.php?t=26765][color=red][b]③减肥茶(半淘汰)[/b][/color][/url]  [url=https://www.firefox.net.cn/newforum/search.php][color=red][b]④搜索论坛[/b][/color][/url]
zeroieme
千年狐狸
千年狐狸
  • UID12805
  • 注册日期2006-05-17
  • 最后登录2015-10-11
  • 发帖数1407
  • 经验34枚
  • 威望0点
  • 贡献值20点
  • 好评度0点
  • 社区居民
6楼#
发布于:2006-05-18 17:58
我需要的仅是必要时自己直接在网页上修改的扩展
超级47
火狐狸
火狐狸
  • UID10550
  • 注册日期2005-12-13
  • 最后登录2017-03-08
  • 发帖数192
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
  • 社区居民
7楼#
发布于:2006-05-18 17:58
找个能直接修改网页内容的插件就可以了吧,不知道有没有
fiag
管理员
管理员
  • UID1188
  • 注册日期2004-12-21
  • 最后登录2024-04-22
  • 发帖数4681
  • 经验686枚
  • 威望0点
  • 贡献值402点
  • 好评度51点
8楼#
发布于:2006-05-18 17:58
zeroieme:由于中文为双字节或3字节(UTF-8)编码,偶有些网页因为缺了1个字节引起一串乱码,如:
舜寺衣胛票嗉魈匾庵圃
通常我是保存网页后用WinHex修改。求高手制作一扩展,可以直接在firefox上补上1个字节。
回到原帖


我想知道一下破乱码的具体实现方法, 一般来说一个汉字分为高字节和低字节, 但是丢失一个字节后要能自动知道丢的是哪一个可能有点麻烦吧?
zeroieme
千年狐狸
千年狐狸
  • UID12805
  • 注册日期2006-05-17
  • 最后登录2015-10-11
  • 发帖数1407
  • 经验34枚
  • 威望0点
  • 贡献值20点
  • 好评度0点
  • 社区居民
9楼#
发布于:2006-05-18 17:58
最简单的方法:删掉第一个乱码(靠人类智能:D )的前一 字节(半个汉字),结果是删掉了一个字,后面一串乱码就会恢复。一般不影响阅读。

高级一点就利用那半个汉字和后面的文字联想出正确的汉字
abc@home
千年狐狸
千年狐狸
  • UID6047
  • 注册日期2005-05-16
  • 最后登录2011-01-01
  • 发帖数1681
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度1点
10楼#
发布于:2006-05-18 17:58
maxthon 有一个。可以搜寻 maxthon 中文论坛拿来参考。



WINXP SP2 MAXTHON (UNICODE) PROXOMITRON
fang5566
管理员
管理员
  • UID3719
  • 注册日期2005-03-07
  • 最后登录2024-04-29
  • 发帖数18483
  • 经验4837枚
  • 威望5点
  • 贡献值4316点
  • 好评度1116点
  • 社区居民
  • 最爱沙发
  • 忠实会员
  • 终身成就
11楼#
发布于:2006-05-18 17:58
abc@home:maxthon 有一个。可以搜寻 maxthon 中文论坛拿来参考。回到原帖

不厚道! 干吗不把地址贴出来 或者转过来?
Firefox More than meets your experience
xincentre
非常火狐
非常火狐
  • UID12562
  • 注册日期2006-05-02
  • 最后登录2022-06-19
  • 发帖数705
  • 经验15枚
  • 威望0点
  • 贡献值4点
  • 好评度0点
  • 社区居民
12楼#
发布于:2006-05-18 17:58
fang5566
不厚道! 干吗不把地址贴出来 或者转过来?
回到原帖

就是,俺在maxthonforum广告Fx从来都贴地址的    
abc@home
千年狐狸
千年狐狸
  • UID6047
  • 注册日期2005-05-16
  • 最后登录2011-01-01
  • 发帖数1681
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度1点
13楼#
发布于:2006-05-18 17:58
找不到中文帖,看英文帖吧:

http://forum.maxthon.com/index.php?showtopic=32599

in program,every english character is represented by one byte, but every chinese character by two. when program reads a string of chinese language, it will try to combine every two byte in order and find the corresponding word image, then print it to the screen. so we can read normal text.
think about if the first byte of the string is missing but the program does't awared of that, it explains the string as usual, finds no or error corresponding word image and results in unreadable text on the screen.
for network or other file error reasons, this instance may happen when we surf over the web. but it does't influence english language. it will also happen for korean and japanese language.
in my plugin program, i just get the bad string, discard the first byte, and put it back to replace it. so the browser will print the right chinese text.
although the first chinese character is lost forever, that is not so perfect, we can read most of the other text, isn't it?


下載: http://tara.maxthon.com/index.php?act=download&id=797



WINXP SP2 MAXTHON (UNICODE) PROXOMITRON
fiag
管理员
管理员
  • UID1188
  • 注册日期2004-12-21
  • 最后登录2024-04-22
  • 发帖数4681
  • 经验686枚
  • 威望0点
  • 贡献值402点
  • 好评度51点
14楼#
发布于:2006-05-18 17:58
看起来这个程序的参考价值有限,因为他只提供了二进制执行文件. 不过起工作方式倒是可以参考的.
游客

返回顶部