求高手翻译论文“自然语言处理”PART(2)

小笼包不怕胖 2021-09-19 09:06 316 次浏览 赞 101

最新问答

  • 艾米莉郡主

    在自然语言处理的领域内有乐观与悲观的周期性存在(我们现在大概是出于乐观期);虽然(技术上)真的有一些进步,但是达到一个全面自然语言处理系统的目标仍然遥不可及。(这里我没有用elusive的直译,难以捉摸,因为放进中文里会很怪,没有人说目标难以捉摸。)历史上,计算机有时对于自然语言处理(的挑战性)过于乐观,其原因很可能就是以上提到的(周期性)。因此从一开始就清楚这个(自然语言处理)的难度的原因是很重要的。
    同时,了解自然语言之间的不同也是很重要的一点。相对于其他自然语言来说,更多的研究重点放在了英文上,主要是因为美国研究者(在这个领域里)的重要性,尽管和欧洲也有很积极的研究学者。可是,在某一方面来讲,英文不是一个具有代表性的语言:它没有音调变化,并且严重依赖单词顺序。教课书和其他英文版的(自然语言处理)启蒙书籍几乎没有包括任何有关(与英语有)不同语法结构的语言的自然语言处理的合适论述。
    我们可以区别起三个完全不同的自然语言处理级别:
    声音
    语法
    语义
    每一个都可以被再分为两到三个亚级别,但这不是本文的重点。在这个简介里我想要做的是阐明在处理每个级别中会遇到的一些问题。
    这里有以英文为母语的南英格兰人说的三个词:输入,纳入,收入(input, intake, income);(请大家)思考这三个词。很显然的,三个词都有相同语义的元素。输入,指的是把什么东西放进去;抽水机的纳入指的是水被抽进去的地方,你的收入指的是你赚的钱(就是进你口袋的钱)。
    三个词中的in元素(在指定说话人的情况下)都发一样的音吗?如果注意听的话就会发现并不是这样。Input 这个词在发音的时候听起来像是拼法是imput的词,而intake听起来就和它的拼法一样。 如果我们用N代表English 里边ng的发音,那么Income就有点iNcome的感觉。
    我特地点出了说话者是从南英格兰来的本土人,因为很多苏格兰人说英文的时候都没有这种习惯,就像所有其他英文母语者在慢慢地富有感情的说这三个词的时候一样,他们都会将in的发音发成和它拼法一样。
    有趣的是,不论在他们自己或是其他人的言语中,以英文为母语者通常都不会注意到这些差别。这不是因为他们没办法分辨m ,n ,N 这三种发音。Rum, Run, Rung这三个词就只有m, n, N这三个发音处不同而已,所有英文母语者都可以很好的区别它们。

    浏览 154赞 90时间 2024-01-19
  • libby131313

    有乐观和悲观的周期在领域的NLP (我们当前可能到在一个更加乐观的阶段之内); 虽然一些非常真正的前进被做了,一个一般NLP系统的目标依然是逃避。 历史上,计算机学家经常是远太过于乐观关于NLP,大概着名的某些的原因以上。 是确切正确地从外边因而是重要的任务为什么是困难的。
    It也是重要注意到,有自然语言之间的区别。 由于美国研究员的重要性更多工作在英语大概被完成了比在其他语言,主要,虽然有非常活跃工作者在欧洲和。 然而,因为它使用少量变化并且沉重依靠词序,英语在一些方面是一种非典型语言。 用英语和其他介绍来源写的课本很少包含关于语言的NLP的充分讨论与明显不同的语法结构。
    We可能区别至少三个分明‘水平’在处理NL :
    Sounds
    Grammar
    Meaning
    Each可以被划分成两个或多个分段,不需要有关我们这里。 什么我在这简要的介绍想要做是说明某些在处理每个水平的问题。

    Consider这三个词,讲话由从英国的南部的一个当地讲英语者: 输入,入口,收入。 是确切全部三个词包含元素与同一个意思。 要输入是投入某事; 水泵的入口是水被采取的地方; 您的收入是您赢得,即进来的金钱。
    Is元素在发音了同样在所有三个词(由指定的报告人) ? 仔细听表示,它不是。 词输入是显著的,好象被拼写的imput,而入口发音如被拼写。 如果我们让声音通常被拼写的ng的N立场用英语(即在词象唱歌或歌手),则收入是 因为苏格兰语英语许多报告人这样,不表现I指定了从英国的南部的当地讲英语者; 反而他们一贯地发音所有三个词的第一个元素,当它被拼写,即作为(象可以所有讲英语者,当慢慢地和强调地讲话)时。
    Interestingly,讲英语者对这些区别通常是相当未察觉的,在他们自己的讲话和其他的讲话上。 这不是,因为他们不可能区别在三声音m、n和N.之间。 三个词兰姆酒、奔跑和阶在这三声音仅不同并且是相当分明的对所有当地讲英语者。

    浏览 286赞 157时间 2022-07-15
  • baibaicause

    已经有 NLP( 我们可能地是目前在比较乐观的时期中) 的领域乐观主义和悲观的周期;虽然一些非常真正的进步已经被做,但是一般的 NLP 系统的目标保持难懂。历史地, 计算机科学家时常是甚远地太结束- 乐观的有关 NLP 的事,或许为被记录在上面的一些理由。 完全地从着手是清楚的是如此重要工作为什么很困难。
    它是也重要的在自然语言之间有不同。 较多的工作或许已经在英国人上被做比较在任何其他的语言上,因为美国研究员的重要主要地, 虽然有欧洲和的非常活跃的工人。 然而,英国人是在一些方法中一种不典型的语言,如同它使用很少的屈曲而且很重地仰赖字次序一样。 教科书和很少地以英国语写成的其他介绍的来源为和显着不同文法的结构语言包含 NLP 的适当讨论。
    我们能在处理 NL 方面至少区别三清楚的 '水平':
    声音
    文法
    意义
    每个可能被区分为二或较多的次水平,在这里不需要与我们有关。 我在这做简短的介绍要在处理每个水平方面举例说明一些问题的。

    考虑这三个字, 被来自英国的南方一位自然的英国语说者讲: 输入,吸入,收入。 很清楚地 , 所有的三个字包含元素在由于相同的意义。到输入要把某物放入;水泵的吸入是水被拿的地方在;你的收入是你赚得的钱,也就是 那进来。
    元素是在发音吗相同的在所有的三个字中?(藉着被叙述的说者) 小心的听将会它不是。 字输入是显着的好像 spelt imput, 然而吸入是发音如 spelt。 如果我们用英国语通常让 N 代表声音 spelt ng(举例来说 在字同类中唱或歌手), 然后收入是
    因为摊派的款项英国人的许多说者不这样举止;当它是 spelt 的时候 , 改为他们一致地宣告所有的三个字的第一种元素 , 所以我叙述了来自英国的南方自然的英文说者,也就是 同样地在.( 当可能之时所有的英文说者当慢慢地而且强调地的时候)
    有趣地,英文的说者是通常相当不知道的这些不同,在他们自己的演讲和其它的演讲都。这是不因为他们不能够区别三声音 m, 古怪的 n 和 N. 三个字, 跑,而且脚蹬横木只在这三种声音中和相当不一致对所有的自然英文的说者是清楚的。

    浏览 242赞 127时间 2021-12-08

求高手翻译论文“自然语言处理”PART(2)