lmfe
小狐狸
小狐狸
  • UID25934
  • 注册日期2008-08-22
  • 最后登录2013-01-21
  • 发帖数42
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
15楼#
发布于:2009-03-21 16:23
楼主这个想法太好了  现在工作有什么进展吗?
lmfe
小狐狸
小狐狸
  • UID25934
  • 注册日期2008-08-22
  • 最后登录2013-01-21
  • 发帖数42
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
16楼#
发布于:2009-03-21 16:23
楼主提到的扩展不错,还能导入xml文件,可以考虑写个专门的小软件或者脚本,生成单词xml文件。不过单词多了排版是个问题,页面容易乱……
aboutme
小狐狸
小狐狸
  • UID14612
  • 注册日期2006-09-17
  • 最后登录2019-12-05
  • 发帖数76
  • 经验26枚
  • 威望0点
  • 贡献值26点
  • 好评度-1点
17楼#
发布于:2009-03-21 16:23
lmfe:楼主这个想法太好了  现在工作有什么进展吗?回到原帖


进展就是:找到一个Foxreplace扩展,和我说的原理一样,但不够理想 https://addons.mozilla.org/en-US/firefox/addon/6510

不知道如何批量导入一个单词表, 使用者必须自己一个一个添加。

不知道如何把现有的网路上的免费词库做成Xml文件,或批量导入。

还有就是词典起码要人工编辑一遍,就算纯粹搞名词,也要提纯。

或者按照中文网络词频表,找出人们普遍不认识的对应的单词,找最贴近的那个英文单词。

我认为,谷歌的语言专家应该放弃以句子为单位的机器翻译,而应该转向以单词替换提示的方式。
aboutme
小狐狸
小狐狸
  • UID14612
  • 注册日期2006-09-17
  • 最后登录2019-12-05
  • 发帖数76
  • 经验26枚
  • 威望0点
  • 贡献值26点
  • 好评度-1点
18楼#
发布于:2009-03-21 16:23
lmfe:楼主提到的扩展不错,还能导入xml文件,可以考虑写个专门的小软件或者脚本,生成单词xml文件。不过单词多了排版是个问题,页面容易乱……回到原帖

我不懂程序啊。排版不是问题,可以设定每页出现的次数N。
lmfe
小狐狸
小狐狸
  • UID25934
  • 注册日期2008-08-22
  • 最后登录2013-01-21
  • 发帖数42
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
19楼#
发布于:2009-03-21 16:23
怎么设定每页出现的次数呢? 您说的那个扩展foxreplac好像不行吧 没这个参数啊 。程序我可以自己想想办法,只会autohotkey,应该可以对付,呵呵。  实在不行还可以找人帮忙写。应该写2个小程序,一个负责处理网络上的单词,做成这种格式, 火狐(Firefox),另外一个负责把单词表转换为xml文件。
lmfe
小狐狸
小狐狸
  • UID25934
  • 注册日期2008-08-22
  • 最后登录2013-01-21
  • 发帖数42
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
20楼#
发布于:2009-03-21 16:23
楼主有啥意见提啊 差不多了就找人写程序 呵呵

单词例子
befall  降临到...(指坏事)
chain  一连串;链子,链条
astronomical  天文的(比喻极大的)
fatuous  愚蠢的;荒唐的
unduly  不适当地,过度地,不正当地

1、手动除去不想要的一些符号,比如“,“号,()及其内的多余释义,【】或者[]号及其内的音标,都是查找替换的事

2、利用程序把多意词汇后的释义分解成独立的一行,比如chain单独列成
chain 一连串
chain 链子
chain 链条


3、利用程序将得到的单词表生成如下所示的xml文件(呵呵 我试验的例子 foxreplace 导出的xml文件)

- <substitutionlist version="0.10">
- <group>
  <urls />
- <substitutions>
- <substitution>
  <input type="text">"阿泰斯特"</input>
  <output>"阿泰斯特(Atest)"</output>
  </substitution>
- <substitution>
  <input type="text">"姚明"</input>
  <output>"姚明(YaoMing)"</output>
  </substitution>
- <substitution>
  <input type="text">"NBA"</input>
  <output>"NBA(全美职业篮球联赛)"</output>
  </substitution>
- <substitution>
  <input type="text">"篮板球"</input>
  <output>"篮板球(Rebound)"</output>
  </substitution>
- <substitution>
  <input type="text">"布鲁克斯"</input>
  <output>"布鲁克斯(Brooks)"</output>
  </substitution>
  </substitutions>
  </group>
  </substitutionlist>
aboutme
小狐狸
小狐狸
  • UID14612
  • 注册日期2006-09-17
  • 最后登录2019-12-05
  • 发帖数76
  • 经验26枚
  • 威望0点
  • 贡献值26点
  • 好评度-1点
21楼#
发布于:2009-03-21 16:23
谢谢楼上这么热情。

在汉语文章但中显示因为单词,又一个麻烦,一个汉语通常有几个对应英文,但纯名词可能对应的好一点,而据说名词有占据英文的绝大部分,建议先搞纯名词试点。反正人们比较烦比较专业的英文名词,哈哈。

foxreplace扩展的帮助里似乎有很多正则表达式的写法,我不懂,高手应该会控制每页面出现的个数。

词表的话,我如果有空,可以纯手工的按汉语词频列表翻译成

中国,中国(china)

的列表。

其实这个主意将来逆向过来,可以帮助有初高中英语水平的人阅读英文网页。这些人如果认识所有单词,就能理解意思了。
例如:
china,china(1,中国,2,瓷器)

英语4万词频我手里也有。

总体看,手工编写我可以做,但我学习单词的热情已在去年过去了,哈哈

程序做,估计需要一个单词表,和简洁的汉语意思。金山词霸导出的 生词本.txt 的格式估计可以利用,哈哈,

唉,没有技术,简单的事情都很困难。

我也不是非想搞此插件,我只是一个普通用户,热情很快就没了。不懂技术,这个帖子只是给高手提个主意。

Ps:火狐插件作者写的插件,火狐基金会会给他们钱吗?哈哈
aboutme
小狐狸
小狐狸
  • UID14612
  • 注册日期2006-09-17
  • 最后登录2019-12-05
  • 发帖数76
  • 经验26枚
  • 威望0点
  • 贡献值26点
  • 好评度-1点
22楼#
发布于:2009-03-21 16:23
感觉在英文文字内安插 括弧中文词,是长远之计啊。
aboutme
小狐狸
小狐狸
  • UID14612
  • 注册日期2006-09-17
  • 最后登录2019-12-05
  • 发帖数76
  • 经验26枚
  • 威望0点
  • 贡献值26点
  • 好评度-1点
23楼#
发布于:2009-03-21 16:23
其实最简单的就是沿着汉语名词表,用谷歌翻译,这个名词表。因为名词量大,匹配度也高。

改造成
- <substitutionlist version="0.10">
- <group>
<urls />
- <substitutions>
- <substitution>
<input type="text">"阿泰斯特"</input>
<output>"阿泰斯特(Atest)"</output>
</substitution>
- <substitution>
<input type="text">"姚明"</input>
<output>"姚明(YaoMing)"</output>
</substitution>
- <substitution>

然后和网友分享Xml文件即可。

或者高手自己立门户发扬光大。哈哈

基本上就这些要求了。

还有,()(),用英文括弧,看起来紧凑一些。
aboutme
小狐狸
小狐狸
  • UID14612
  • 注册日期2006-09-17
  • 最后登录2019-12-05
  • 发帖数76
  • 经验26枚
  • 威望0点
  • 贡献值26点
  • 好评度-1点
24楼#
发布于:2009-03-21 16:23
aboutme:感觉在英文文字内安插 括弧中文词,是长远之计啊。回到原帖


或者干脆出2个版本:

英文文章显中文

中文文章显英文
futurekb3
小狐狸
小狐狸
  • UID22646
  • 注册日期2008-01-15
  • 最后登录2012-09-25
  • 发帖数30
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
25楼#
发布于:2009-03-21 16:23
foxreplace我已经试用了2天,功能完全够用,并且支持正则表达式.但输入20个单词后发现一个很严重的缺陷:每打开一个网页都要卡一下.这是因为这个扩展会搜索页面上所有相匹配的文字然后再替换.现在卡得还不算太严重,如果单词量到上千时会不会卡得打不开?
aboutme
小狐狸
小狐狸
  • UID14612
  • 注册日期2006-09-17
  • 最后登录2019-12-05
  • 发帖数76
  • 经验26枚
  • 威望0点
  • 贡献值26点
  • 好评度-1点
26楼#
发布于:2009-03-21 16:23
futurekb3:foxreplace我已经试用了2天,功能完全够用,并且支持正则表达式.但输入20个单词后发现一个很严重的缺陷:每打开一个网页都要卡一下.这是因为这个扩展会搜索页面上所有相匹配的文字然后再替换.现在卡得还不算太严重,如果单词量到上千时会不会卡得打不开?回到原帖

成千上万理论上不是必须,如果能根据表达式限定数目N,既可以不卡,我认为。

一个页面出现10个以上英文,会降低读者对英文的关注度,或好奇心,

每页10个或更少,长久上中文网络阅读的同时顺道熟悉几个单词,真是乐趣啊。

关键是正则表达式能否限制出现数量N,等待高手出现,或给Foxreplace作者写信求助开发面向外国人学中文的。给他们整千把比较像形的,有意思的汉字,足够外国的中文爱好者爽歪歪了。
lmfe
小狐狸
小狐狸
  • UID25934
  • 注册日期2008-08-22
  • 最后登录2013-01-21
  • 发帖数42
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
27楼#
发布于:2009-03-21 16:23
楼主 搞定了 呵呵
找人写了个程序,不过单词文件事先要自己处理下,把无用的符号去除
附件程序:把单词列表粘贴进左边的窗口里,按下command2 ,复制右边最下面窗口里的内容到记事本里,保存为utf-8格式的文件,然后更改扩展名为xml,导入foxreplace即可。

如果要编辑单词,就把右边最上面的单词复制下来,编辑好,重新粘贴进左边最上面的窗口中,重新生成即可。
附件名称/大小 下载次数 最后更新
工程1(2).rar (5KB)  69 2009-03-24 21:34
工程1(2).rar (5KB)  74 2009-03-24 21:17
lmfe
小狐狸
小狐狸
  • UID25934
  • 注册日期2008-08-22
  • 最后登录2013-01-21
  • 发帖数42
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
28楼#
发布于:2009-03-21 16:23
多传了一次,呵呵
单词文件的处理就是要处理成这种格式   file 文件 档案
中间用空格间隔
lmfe
小狐狸
小狐狸
  • UID25934
  • 注册日期2008-08-22
  • 最后登录2013-01-21
  • 发帖数42
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
29楼#
发布于:2009-03-21 16:23
这个程序处理的单词量大概只有500左右,还在完善中,另外处理的单词导入之后还需要在手工检查一遍,目前导入500,普通的页面处理速度还可以,2、3秒左右,文字太多的肯定就慢了,比如新浪的首页要5、6秒。
游客

返回顶部