3.2.3 自然语言处理 NLP

NLP 几大任务

自然语言处理(简称NLP),是研究计算机处理人类语言的一门技术,包括:

  1. 句法语义分析:对于给定的句子,进行分词、词性标记、命名实体识别和链接、句法分析、语义角色识别和多义词消歧。
  2. 信息抽取:从给定文本中抽取重要的信息,比如,时间、地点、人物、事件、原因、结果、数字、日期、货币、专有名词等等。通俗说来,就是要了解谁在什么时候、什么原因、对谁、做了什么事、有什么结果。涉及到实体识别、时间抽取、因果关系抽取等关键技术。
  3. 文本挖掘(或者文本数据挖掘):包括文本聚类、分类、信息抽取、摘要、情感分析以及对挖掘的信息和知识的可视化、交互式的表达界面。目前主流的技术都是基于统计机器学习的。
  4. 机器翻译:把输入的源语言文本通过自动翻译获得另外一种语言的文本。根据输入媒介不同,可以细分为文本翻译、语音翻译、手语翻译、图形翻译等。机器翻译从最早的基于规则的方法到二十年前的基于统计的方法,再到今天的基于神经网络(编码-解码)的方法,逐渐形成了一套比较严谨的方法体系。
  5. 信息检索:对大规模的文档进行索引。可简单对文档中的词汇,赋之以不同的权重来建立索引,也可利用1,2,3的技术来建立更加深层的索引。在查询的时候,对输入的查询表达式比如一个检索词或者一个句子进行分析,然后在索引里面查找匹配的候选文档,再根据一个排序机制把候选文档排序,最后输出排序得分最高的文档。
  6. 问答系统: 对一个自然语言表达的问题,由问答系统给出一个精准的答案。需要对自然语言查询语句进行某种程度的语义分析,包括实体链接、关系识别,形成逻辑表达式,然后到知识库中查找可能的候选答案并通过一个排序机制找出最佳的答案。
  7. 对话系统:系统通过一系列的对话,跟用户进行聊天、回答、完成某一项任务。涉及到用户意图理解、通用聊天引擎、问答引擎、对话管理等技术。此外,为了体现上下文相关,要具备多轮对话能力。同时,为了体现个性化,要开发用户画像以及基于用户画像的个性化回复。

随着深度学习在图像识别、语音识别领域的大放异彩,人们对深度学习在NLP的价值也寄予厚望。再加上AlphaGo的成功,人工智能的研究和应用变得炙手可热。自然语言处理作为人工智能领域的认知智能,成为目前大家关注的焦点。很多研究生都在进入自然语言领域,寄望未来在人工智能方向大展身手。但是,大家常常遇到一些问题。俗话说,万事开头难。如果第一件事情成功了,学生就能建立信心,找到窍门,今后越做越好。否则,也可能就灰心丧气,甚至离开这个领域。这里针对给出我个人的建议,希望我的这些粗浅观点能够引起大家更深层次的讨论。

来源:知乎微软亚洲研究院

NLP 任务解决情况

  1. 句法语义分析:
  2. 信息抽取:
  3. 文本挖掘:
  4. 机器翻译:
  5. 信息检索:
  6. 问答系统:
  7. 对话系统:

NLP 阅读资料

  • 国际学术组织、学术会议与学术论文

    • 协会 The Association for Computational Linguistics(ACL)
      • 兴趣小组 SIGDAT(Linguistic data and corpus-based approaches to NLP)
      • 兴趣小组 SIGNLL(Natural Language Learning)
    • 会议 EMNLP(Conference on Empirical Methods on Natural Language Processing)
    • 会议 CoNLL(Conference on Natural Language Learning)
    • 协会 International Committee on Computational Linguistics
    • 会议 COLING(Interantional Conference on Computational Linguistics)
    • 网站 ACL Anthology
    • 期刊 Computational Linguistics
    • 期刊 Transactions of ACL, TACL
    • 期刊 ACM Transactions on Speech and Language Processing
    • 期刊 ACM Transactions on Asian Language Information Processing
    • 期刊 Journal of Quantitative Linguistics
    • 信息检索和数据挖掘领域相关会议 SIGIR
    • 信息检索和数据挖掘领域相关会议 WWW
    • 信息检索和数据挖掘领域相关会议 WSDM
    • 人工智能领域相关会议 AAAI
    • 人工智能领域相关会议 IJCAI
    • 人工智能领域相关期刊 Artificial Intelligence
    • 人工智能领域相关期刊 Journal of AI Research
    • 机器学习领域相关会议 ICML
    • 机器学习领域相关会议 NIPS
    • 机器学习领域相关会议 AISTATS
    • 机器学习领域相关会议 UAI
    • 机器学习领域相关期刊 Journal of Machine Learning Research (JMLR)
    • 机器学习领域相关期刊 Machine Learning (ML)
    • 中国计算机学会推荐国际学术会议和期刊目录
    • 博客 natural language processing
    • ACL Wiki
    • 文章 NOW Publisher - Foundations and Trends
    • 文章 Morgan & Claypool Publisher - Synthesis Lectures on Human Language Technologies
    • 演讲 videolectures.net
  • 国内学术组织、学术会议与学术论文

    • 协会 中国中文信息学会
    • 会议 全国计算语言学学术会议(CCL)
    • 会议 全国青年计算语言学研讨会(YCCL)
    • 会议 全国信息检索学术会议(CCIR)
    • 会议 全国机器翻译研讨会(CWMT)
    • 会议 自然语言处理与中文计算会议 (NLP&CC)
    • 期刊 中文信息学报
    • 期刊 计算机学报
    • 期刊 软件学报
    • 微博 王威廉
    • 微博 李沐
    • 博客 52nlp

来源:刘知远博客

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 156,423评论 4 359
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 66,339评论 1 289
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 106,241评论 0 237
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,503评论 0 203
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 51,824评论 3 285
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,262评论 1 207
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,615评论 2 309
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,337评论 0 194
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 33,989评论 1 238
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,300评论 2 240
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,829评论 1 256
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,193评论 2 250
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,753评论 3 230
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 25,970评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,708评论 0 192
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,295评论 2 267
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,207评论 2 258