《Java自然语言处理》_邹伟等译

[复制链接]
online_admin aixure 发表于 2023-1-23 09:35:40 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
093526szwv1a11s5l5514f
售 价: ¥5¥89加入会员,免费下载
库 存:9999
销 量:12
源 址:
卖家服务:  
客 服:QQ(早10点-晚6点)
资源详情
内容简介  · · · · · ·

自然语言处理(NLP)是应用程序开发的重要领域,在解决实际问题中起着越来越重要的作用。NLP任务支持的自然语言可访问应用程序需求显著增。本书将探索如何使用诸如全文本搜索、专有名称识别、聚类、标记、信息提取、汇总等方法自主组织文本。书中涵盖了NLP的概念,即使没有统计或自然语言处理背景的人也可以理解它。




作者简介  · · · · · ·

Richard M. Reese曾就职于学术界和工业界。他曾在电信和航天工业领域工作17年,期间曾担任研发、软件开发、监督和培训等多个职位。他目前任教于塔尔顿州立大学,运用他多年来积累的行业经验来完善他的课程。

Richard曾出版过关于Java和C的书籍,他使用简洁易用的方法讨论主题,这些书籍包括《EJB 3.1 Cookbook》,有关Java 7和Java 8的新功能、Java认证以及jMonkey引擎,以及一本关于C指针的书。




目录  · · · · · ·译者序
作者简介
审校者简介
前言
第1章 NLP简介 1
1.1 什么是NLP 2
1.2 为何使用NLP 3
1.3 NLP的难点 4
1.4 NLP工具汇总 5
1.4.1 Apache OpenNLP 6
1.4.2 Stanford NLP 7
1.4.3 LingPipe 9
1.4.4 GATE 10
1.4.5 UIMA 10
1.5 文本处理概览 10
1.5.1 文本分词 11
1.5.2 文本断句 12
1.5.3 人物识别 14
1.5.4 词性判断 16
1.5.5 文本分类 17
1.5.6 关系提取 18
1.5.7 方法组合 20
1.6 理解NLP模型 20
1.6.1 明确目标 20
1.6.2 选择模型 21
1.6.3 构建、训练模型 21
1.6.4 验证模型 22
1.6.5 使用模型 22
1.7 准备数据 22
1.8 本章小结 24
第2章 文本分词 25
2.1 理解文本分词 25
2.2 什么是分词 26
2.3 一些简单的Java分词器 28
2.3.1 使用Scanner类 29
2.3.2 使用split方法 30
2.3.3 使用BreakIterator类 31
2.3.4 使用StreamTokenizer类 32
2.3.5 使用StringTokenizer类 34
2.3.6 使用Java核心分词法的性能考虑 34
2.4 NLP分词器的API 34
2.4.1 使用OpenNLPTokenizer类分词器 35
2.4.2 使用Stanford分词器 37
2.4.3 训练分词器进行文本分词 41
2.4.4 分词器的比较 44
2.5 理解标准化处理 45
2.5.1 转换为小写字母 45
2.5.2 去除停用词 46
2.5.3 词干化 49
2.5.4 词形还原 51
2.5.5 使用流水线进行标准化处理 54
2.6 本章小结 55
第3章 文本断句 56
3.1 SBD方法 56
3.2 SBD难在何处 57
3.3 理解LingPipe的HeuristicSen-tenceModel类的SBD规则 59
3.4 简单的Java SBD 60
3.4.1 使用正则表达式 60
3.4.2 使用BreakIterator类 62
3.5 使用NLP API 63
3.5.1 使用OpenNLP 64
3.5.2 使用Stanford API 66
3.5.3 使用LingPipe 74
3.6 训练文本断句模型 78
3.6.1 使用训练好的模型 80
3.6.2 使用SentenceDetector-Evaluator类评估模型 81
3.7 本章小结 82
第4章 人物识别 83
4.1 NER难在何处 84
4.2 NER的方法 84
4.2.1 列表和正则表达式 85
4.2.2 统计分类器 85
4.3 使用正则表达式进行NER 86
4.3.1 使用Java的正则表达式来寻找实体 86
4.3.2 使用LingPipe的RegEx-Chunker类 88
4.4 使用NLP API 89
4.4.1 使用OpenNLP进行NER 89
4.4.2 使用Stanford API进行NER 95
4.4.3 使用LingPipe进行NER 96
4.5 训练模型 100
4.6 本章小结 103
第5章 词性判断 104
5.1 词性标注 104
5.1.1 词性标注器的重要性 107
5.1.2 词性标注难在何处 107
5.2 使用NLP API 109
5.2.1 使用OpenNLP词性标注器 110
5.2.2 使用Stanford词性标注器 118
5.2.3 使用LingPipe词性标注器 125
5.2.4 训练OpenNLP词性标注模型 129
5.3 本章小结 131
第6章 文本分类 132
6.1 文本分类问题 132
6.2 情感分析介绍 134
6.3 文本分类技术 135
6.4 使用API进行文本分类 136
6.4.1 OpenNLP的使用 136
6.4.2 Stanford API的使用 140
6.4.3 使用LingPipe进行文本分类 145
6.5 本章小结 152
第7章 关系提取 153
7.1 关系类型 154
7.2 理解解析树 155
7.3 关系提取的应用 156
7.4 关系提取 159
7.5 使用NLP API 159
7.5.1 OpenNLP的使用 159
7.5.2 使用Stanford API 162
7.5.3 判断共指消解的实体 166
7.6 问答系统的关系提取 168
7.6.1 判断单词依赖关系 169
7.6.2 判断问题类型 170
7.6.3 搜索答案 171
7.7 本章小结 173
第8章 方法组合 174
8.1 准备数据 175
8.1.1 使用Boilerpipe从HTML中提取文本 175
8.1.2 使用POI从Word文档中提取文本 177
8.1.3 使用PDFBox从PDF文档中提取文本 181
8.2 流水线 182
8.2.1 使用Stanford流水线 182
8.2.2 在Standford流水线中使用多核处理器 187
8.3 创建一个文本搜索的流水线 188
8.4 本章小结 193


温馨提示:
1、如果下载地址失效,请尽快反馈给我们,我们尽快修复。点此反馈>>
2、全站资源高清无密,课程百分百高清,完整,原画,包含所有的视频+素材+课件+源码,官方同步体验!每天更新,成为vip后可免费下载本站IT课程。点此办理会员>>
3、有任何问题,请咨询QQ:87887023
4、支持7*24小时自助购买,购买后自动发货,链接永久有效,自动更新
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

专注资源整合与知识分享
客服QQ

87887023

周一至周日9:00-23:00

反馈建议

点此进行反馈 kfs 在线QQ咨询
ftqrcode

扫描二维码关注我们

label_sm_90020

Powered by 优百课栈 X3.4© 2019-2025