0717-7821348
爱彩人App推广

爱彩人App推广

您现在的位置: 首页 > 爱彩人App推广
5本自然语言处理书单-附pdf
2019-05-31 23:03:28

文章发布于公号【数智物语】 (ID:decision_engine),重视公号不错失每一篇干货。

自然言语处理(英语:Natural Language Processing,缩写作 NLP)是人工智能和言语学范畴的分支学科。此范畴评论怎样处理及运用自然言语。自然言语处理研讨的内容包含但不限于如下分支范畴:文本分类、信息抽取、主动摘要、智能问答、论题引荐、机器翻译、主题词辨认、常识库构建、深度文本表明、命名实体辨认、文本生成、文本分析(词法、句法、语法)、语音辨认与组成等。以下自然言语处理书本由数智物语依据揭露资料、豆瓣评分归纳收拾。

01

书单

01

Speech and Language Processing (3rd ed. draft)



作者:Daniel Jurafsky / James H. Martin

书本简介:2018年9月23日自然言语处理范畴经典总述教材《Speech and Language Processing 》,中文名《自然言语处理总述》第三版发布。该书由 NLP 范畴的大牛,斯坦福大学 Daniel Jurafsky 教授和科罗拉多大学的 James H. Martin 教授等人一起编写。Daniel Jurafsky 是斯坦福大学核算机科学教授,首要研讨方向是核算言语学和自然言语处理。 James H. Martin 是科罗拉多大学博尔德分校核算机科学系一名教授,两位教授都是 NLP 范畴闻名学者。

引荐理由:经典的 NLP 教科书,包含了一切 NLP 的根底常识,也被国外许多闻名大学选为自然言语处理和核算言语学课程的首要教材。本书写作风格引人入胜,深化技能细节而又不让人感觉单调,不只能够作为高等学校自然言语处理和核算言语学等课程的本科生和研讨生教材,关于自然言语处理相关范畴的研讨人员和技能人员也是不可或缺的威望参考书。

阅览链接:https://web.stanford.edu/~jurafsky/slp3/

02

Foundations of Statistical Natural Language Processing



作者:Christopher Manning and Hinrich Schtze

书本简介:本书包含的内容十分广泛,分为四个部分,共16章,包含了构建自然言语处理软件东西将用到的简直一切理论和算法。全书的论说进程由浅入深,从数学根底到准确的理论算法,从简略的词法分析到杂乱的语法分析,合适不同水平的读者群的需求。一起,《核算自然言语处理根底:国外核算机科学教材系列》将理论与实践紧密联系在一起,在介绍理论常识的根底上给出了自然言语处理技能的高层运用(如信息检索等)。

引荐理由:经典的核算自然言语处理入门教材。内容触及核算自然言语处理用到的数学根底,词法到语法分析,以及自然言语处理的基本使命(比方文本分类、聚类,核算机器翻译,以及信息检索)。本教材成书较早5本自然语言处理书单-附pdf(195本自然语言处理书单-附pdf99年),可是自然言语处理范畴的基本概念和使命没有太大的改变,依然适用于初学者快速了解自然言语处理相关的概念和使命,中文版别为《核算自然言语处理根底:国外核算机科学教材系列》(电子工业出书社出书)。

阅览链接:https://nlp.stanford.edu/fsnlp/

03

Neural Network Methods in Natural Language Processing (Synthesis Lectures on Human Language Technologies)



作者:Yoav Goldberg

书本简介:本书侧重介绍神经网络模型在自然言语数据中的运用。书的前半部分介绍了有监督的机器学习和前馈神经网络的根底常识,根据言语数据的机器学习的根底常识。它还包含了能够界说和练习恣意神经网络的核算图形笼统方面的常识,是今世神经网络软件库规划的根底。本书的第二部分介绍了更多专门的神经网络体系结构,包含一维卷积神经网络、递归神经网络、条件生成模型和根据注意力的模型。这些体系结构和技能是机器翻译、句法分析和许多其他运用程序的最先进算法的推进力气。最终,本书还评论了树形网络,结构化猜测和多使命学习的远景。

引荐理由:最近几年由于深度学习的鼓起,使得图像辨认、语音辨认等多5本自然语言处理书单-附pdf个方面都发生了很大的革新。深度学习在自然言语处理方面也是十分遍及了,一些经典的自然言语形式也都是根据神经网络的,这本书是现在市面上仅有一本介绍神经网络在自然言语处理的运用,而且书中的很多参考文献十分有价值。本书的作者在这个范畴十分闻名,而且对待学术情绪极端谨慎。

阅览链接:http://library1.org/_ads/7ECBFA717EC2AAF7E2F20AA3597D1C8C

04

Natural Language Processing with Python



作者:Steven Bird / Ewan Klein / Edward Loper

书本简介:本书教你怎样用 Python 和 NLTK 库来做 NLP。供给了十分易学的自然言语处理入门介绍,该范畴包含从文本和电子邮件猜测过滤,到主好听的英文网名动总结和翻译等多种言语处理技能。你还将经过运用归纳言语数据结构拜访含有丰厚注释的数据集,了解用于分析书面通讯内容和结构的首要算法。

引荐理由:这本书的实用性较强。假如你对 Python 与 NLTK 感兴趣,就看这本书,能够作为入门读物来看,整本书即触及到了语料库的操作,也对传统的根据规矩的办法有所触及。全书包含了分词(tokenization)、词性标示(POS)、语块(Chunk)标示、句法分析与语义分析等方面,是 NLP 中不错的一本实用教程。

阅览链接:http://www.nltk.org/book/

05

Introduction to Information Retrieval



作者:Christopher D.Manning / Prabhakar Raghavan /Hinrich Schtze

书本简介:本书从核算机科学范畴的视点动身,介绍了信息检索的根底常识,并对当时信息检索的开展做了回忆,要点介绍了查找引擎的核心技能,如文档分类和文档聚类问题,以及机器学习和数值核算办法。书中一切重要的思维都用示例进行了解说,生动形象,引人入胜。

引荐理由: 关于排名/查找的优异参考书,作者从最简略的布尔检索到一个完好的查找引擎,逐渐深化,逐渐引导读者考虑,对缔造一个大型查找引擎需求用到的架构和算法都有所涉猎,查找引擎并不只仅是检索信息,它还有一个更重要的用途是对回来的成果进行排序,而这往往是十分重要的。

阅览链接:https://nlp.stanford.edu/IR-book/html/htmledition/irbook.html

02

引荐课程

01

CS224d: Deep Learning for Natural Language Processing

课程导师:Richard Socher

课程链接:http://cs224d.stanford.edu/syllabus.html

首要内容:斯坦福大学自然言语小组根据深度学习的自然言语处理课程。介绍了自然言语处理范畴广泛运用的网络结构(5本自然语言处理书单-附pdf例如循环神经网络、卷积神经网5本自然语言处理书单-附pdf络以及递归神经网络等)及其在自然言语处理的经典使命,例如分类使命(情感分类),序列标示使命(实体辨认),序列到序列的生成使命(机器翻译)等实践运用。

引荐理由:自然言语处理是信息时代最重要的技能之一。了解杂乱的言语也是人工智能的重要组成部分。自然言语处理的运用无处不在,由于人们用言语沟通了大部分内容:网络查找、广告、电子邮件、客户服务、言语翻译、放射学陈述等等。本课程比较合适对这个范畴感兴趣的初学者。

02

Oxford Deep Learning for NLP class

课程导师:Phil Blunsom. Class by Deep Mind NLP Group.

合适人群:中级到高档学者

课程链接:https://machinelearningmastery.com/oxford-course-deep-learning-natural-language-processing/

首要内容:DeepMind 团队成员在牛津大学教授根据深度学习的自然言语处理的课程。内容触及到词嵌入,根据循环神经网络的言语模型,根据循环神经网络和卷积神经网络的文本分类,根据循环神经网络的条件言语模型(广泛运用于机器翻译、文本摘要等)及其间的注意力机制,以及根据深度学习模型的主动问答等首要自然言语处理的使命。

引荐理由:深度学习办法在自然言语处理问题上达到了必定的作用。本课程的大部分资料都能够在线免费获取,比较合适对这个范畴有必定的根底,期望了解最新进展和进一步学习和研讨的同学。

03

其他在线课程

Coursera:自然言语处理简介(由密西根大学供给的NLP课程)

https://www.coursera.org/learn/natural-language-processing

Dan Jurafsky 和 Chris Manning:自然言语处理(十分棒的视频介绍系列)

https://www.youtube.com/watch?v=QIdB6M5WdkI&list=PLl3AijnqmcEhr0fQqPfaC_6PbyVNBLJTE&index=3

03

数据集

数据集:见 Nicolas Iderhoff 在 GitHub 上发布的 NlP 资源汇总:

https://5本自然语言处理书单-附pdfgithub.com/niderhoff/nlp-datasets

* 文中图片来自豆瓣

参考文献

书单 | NLP秘笈,从入门到进阶,微软研讨院AI头条,2017-12-20

独家 | 自然言语处理(NLP)入门学习资源清单,清华大学数据科学研讨院,2017-09-29

数据发掘、机器学习、自然言语处理这三者是什么联系?这几个怎样入门,量子位,2019-01-21


星标我,每天多一点才智