- 最后登录:
- -
- 阅读权限:
- 150
- 主题数:
- 31
- 总积分:
- 10404
- 回帖数:
- 342
- 精华数:
- 0
-
EU:42
RF:7760
Vis:29
Mana:1
AE:4455
|
本帖最后由 mamaruo 于 2023-6-5 16:49 编辑
geic 的问题,我搞不清楚是哪个来源把数据污染了,genetic 给取头尾整了个 geic。
有道词典的网络释义的来源为网络,不可避免地会被污染(来源):
有道网络释义是指有道搜索引擎在抓取并获得多达数十亿的海量网页数据后,利用有道独创的“网页萃取”(Page Extraction)技术进行信息理解、数据挖掘和文本分析工作,从中找出互为翻译关系的中外文词汇和句子,再根据它们在海量网页中出现的频次、位置等因素优化调整,从而得到的最佳翻译结果。
以遗传算法(genetic algorithms)为例。在百度搜索 geic algorithms 会得到一些零散结果,告诉我 geic algorithms 就是遗传算法。但在谷歌学术中搜索 geic algorithms,会发现都指向了 genotype eliminationthrough inheritance constraint (GEIC) algorithms(首次提出的论文),推测国内撰文者混淆了它们,于是产生了网络污染。而学术论文关于遗传算法都用的是 genetic algorithms。
所以,请务必判断好信息来源的可靠性,并做好“多方求证”。咄咄逼人并不会支撑你的观点,实打实的证据才是。
附注:以上论述与译名选取无关,仅作启发严谨和谐讨论之用。
|
|