15楼#
发布于:2009-03-21 16:23
楼主这个想法太好了 现在工作有什么进展吗?
|
|
16楼#
发布于:2009-03-21 16:23
楼主提到的扩展不错,还能导入xml文件,可以考虑写个专门的小软件或者脚本,生成单词xml文件。不过单词多了排版是个问题,页面容易乱……
|
|
17楼#
发布于:2009-03-21 16:23
lmfe:楼主这个想法太好了 现在工作有什么进展吗?回到原帖 进展就是:找到一个Foxreplace扩展,和我说的原理一样,但不够理想 https://addons.mozilla.org/en-US/firefox/addon/6510 不知道如何批量导入一个单词表, 使用者必须自己一个一个添加。 不知道如何把现有的网路上的免费词库做成Xml文件,或批量导入。 还有就是词典起码要人工编辑一遍,就算纯粹搞名词,也要提纯。 或者按照中文网络词频表,找出人们普遍不认识的对应的单词,找最贴近的那个英文单词。 我认为,谷歌的语言专家应该放弃以句子为单位的机器翻译,而应该转向以单词替换提示的方式。 |
|
18楼#
发布于:2009-03-21 16:23
|
|
19楼#
发布于:2009-03-21 16:23
怎么设定每页出现的次数呢? 您说的那个扩展foxreplac好像不行吧 没这个参数啊 。程序我可以自己想想办法,只会autohotkey,应该可以对付,呵呵。 实在不行还可以找人帮忙写。应该写2个小程序,一个负责处理网络上的单词,做成这种格式, 火狐(Firefox),另外一个负责把单词表转换为xml文件。
|
|
20楼#
发布于:2009-03-21 16:23
楼主有啥意见提啊 差不多了就找人写程序 呵呵
单词例子 befall 降临到...(指坏事) chain 一连串;链子,链条 astronomical 天文的(比喻极大的) fatuous 愚蠢的;荒唐的 unduly 不适当地,过度地,不正当地 1、手动除去不想要的一些符号,比如“,“号,()及其内的多余释义,【】或者[]号及其内的音标,都是查找替换的事 2、利用程序把多意词汇后的释义分解成独立的一行,比如chain单独列成 chain 一连串 chain 链子 chain 链条 3、利用程序将得到的单词表生成如下所示的xml文件(呵呵 我试验的例子 foxreplace 导出的xml文件) - <substitutionlist version="0.10"> - <group> <urls /> - <substitutions> - <substitution> <input type="text">"阿泰斯特"</input> <output>"阿泰斯特(Atest)"</output> </substitution> - <substitution> <input type="text">"姚明"</input> <output>"姚明(YaoMing)"</output> </substitution> - <substitution> <input type="text">"NBA"</input> <output>"NBA(全美职业篮球联赛)"</output> </substitution> - <substitution> <input type="text">"篮板球"</input> <output>"篮板球(Rebound)"</output> </substitution> - <substitution> <input type="text">"布鲁克斯"</input> <output>"布鲁克斯(Brooks)"</output> </substitution> </substitutions> </group> </substitutionlist> |
|
21楼#
发布于:2009-03-21 16:23
谢谢楼上这么热情。
在汉语文章但中显示因为单词,又一个麻烦,一个汉语通常有几个对应英文,但纯名词可能对应的好一点,而据说名词有占据英文的绝大部分,建议先搞纯名词试点。反正人们比较烦比较专业的英文名词,哈哈。 foxreplace扩展的帮助里似乎有很多正则表达式的写法,我不懂,高手应该会控制每页面出现的个数。 词表的话,我如果有空,可以纯手工的按汉语词频列表翻译成 中国,中国(china) 的列表。 其实这个主意将来逆向过来,可以帮助有初高中英语水平的人阅读英文网页。这些人如果认识所有单词,就能理解意思了。 例如: china,china(1,中国,2,瓷器) 英语4万词频我手里也有。 总体看,手工编写我可以做,但我学习单词的热情已在去年过去了,哈哈 程序做,估计需要一个单词表,和简洁的汉语意思。金山词霸导出的 生词本.txt 的格式估计可以利用,哈哈, 唉,没有技术,简单的事情都很困难。 我也不是非想搞此插件,我只是一个普通用户,热情很快就没了。不懂技术,这个帖子只是给高手提个主意。 Ps:火狐插件作者写的插件,火狐基金会会给他们钱吗?哈哈 |
|
22楼#
发布于:2009-03-21 16:23
感觉在英文文字内安插 括弧中文词,是长远之计啊。
|
|
23楼#
发布于:2009-03-21 16:23
其实最简单的就是沿着汉语名词表,用谷歌翻译,这个名词表。因为名词量大,匹配度也高。
改造成 - <substitutionlist version="0.10"> - <group> <urls /> - <substitutions> - <substitution> <input type="text">"阿泰斯特"</input> <output>"阿泰斯特(Atest)"</output> </substitution> - <substitution> <input type="text">"姚明"</input> <output>"姚明(YaoMing)"</output> </substitution> - <substitution> 然后和网友分享Xml文件即可。 或者高手自己立门户发扬光大。哈哈 基本上就这些要求了。 还有,()(),用英文括弧,看起来紧凑一些。 |
|
24楼#
发布于:2009-03-21 16:23
|
|
25楼#
发布于:2009-03-21 16:23
foxreplace我已经试用了2天,功能完全够用,并且支持正则表达式.但输入20个单词后发现一个很严重的缺陷:每打开一个网页都要卡一下.这是因为这个扩展会搜索页面上所有相匹配的文字然后再替换.现在卡得还不算太严重,如果单词量到上千时会不会卡得打不开?
|
|
26楼#
发布于:2009-03-21 16:23
futurekb3:foxreplace我已经试用了2天,功能完全够用,并且支持正则表达式.但输入20个单词后发现一个很严重的缺陷:每打开一个网页都要卡一下.这是因为这个扩展会搜索页面上所有相匹配的文字然后再替换.现在卡得还不算太严重,如果单词量到上千时会不会卡得打不开?回到原帖 成千上万理论上不是必须,如果能根据表达式限定数目N,既可以不卡,我认为。 一个页面出现10个以上英文,会降低读者对英文的关注度,或好奇心, 每页10个或更少,长久上中文网络阅读的同时顺道熟悉几个单词,真是乐趣啊。 关键是正则表达式能否限制出现数量N,等待高手出现,或给Foxreplace作者写信求助开发面向外国人学中文的。给他们整千把比较像形的,有意思的汉字,足够外国的中文爱好者爽歪歪了。 |
|
27楼#
发布于:2009-03-21 16:23
楼主 搞定了 呵呵
找人写了个程序,不过单词文件事先要自己处理下,把无用的符号去除
附件程序:把单词列表粘贴进左边的窗口里,按下command2 ,复制右边最下面窗口里的内容到记事本里,保存为utf-8格式的文件,然后更改扩展名为xml,导入foxreplace即可。 如果要编辑单词,就把右边最上面的单词复制下来,编辑好,重新粘贴进左边最上面的窗口中,重新生成即可。 |
|
|
28楼#
发布于:2009-03-21 16:23
多传了一次,呵呵
单词文件的处理就是要处理成这种格式 file 文件 档案 中间用空格间隔 |
|
29楼#
发布于:2009-03-21 16:23
这个程序处理的单词量大概只有500左右,还在完善中,另外处理的单词导入之后还需要在手工检查一遍,目前导入500,普通的页面处理速度还可以,2、3秒左右,文字太多的肯定就慢了,比如新浪的首页要5、6秒。
|
|