最近研究一个翻译系统,对老师上传的一段文本自动拆分成句,乍一听好像很简单哦,split分隔下句号不就完事了嘛!。。。mdzz还是太年轻,一不小心上当了,还有叹号问好双引号呢~!当然这个也不算什么,找个正则表达式就好啦^_^!太天真了!!!劳资突然发现英文简直了,竟然还有缩略词!!!这尼玛怎么分析哦,一顿翻山越岭,发现国内的相关文章有限,对于缩略词都不能有很好的支持,于是在这个时间段,国内严禁翻墙的时间。。。我偷偷翻墙去问问歪果仁了,警察叔叔不要抓我,我只是爱学习的骚年Σ( ° △ °|||)︴    然而实际情况是,歪果仁自己也烦躁他们自己的语言太事逼。。。为什么就不能像中文一样有明显的句子边界呢。。。好吧,我特么也是醉了,正当我一筹莫展之际,一个白胡子老头从天而降,说,骚年,需要帮助吗。别误会,不是援助交际ヽ(=^・ω・^=)丿。。。好吧言归正传,我看到了NLP,并找到了lingpipe,引用起来相当简单,一个下午从接触到实现彻底搞定,说了一堆废话,开始正文!

首先lingpipe直接有jar包进行下载(打不开请翻墙,这是官网的),下载之后放到工程下,有兴趣的的可以了解下lingpipe,不过我英文实在太渣了,就不多介绍别的了,只针对如何进行英文句子边界识别,引用jar包完事以后我们直接创建个util类进行测

java英文段落拆分成句(Split an article into sentences)相关推荐

  1. Java实现英文段落分句_java英文段落拆分成句(Split an article into sentences)

    最近研究一個翻譯系統,對老師上傳的一段文本自動拆分成句,乍一聽好像很簡單哦,split分隔下句號不就完事了嘛!...mdzz還是太年輕,一不小心上當了,還有嘆號問好雙引號呢~!當然這個也不算什么,找個 ...

  2. Java 将字符串拆分成数组,实现字符串组合

    将字符串拆分成数组和实现字符串组合 不能使用语言的基本分割组合函数(如 Java 的 String.split, php 的 explode 和 implode) 1) 字符串拆分成字符串数组,如&q ...

  3. java把一段英文拆成单词_如何在java中将句子拆分成单词和标点符号

    与其试图提出一个模式来进行拆分,不如通过提出一个要捕获的元素的模式来解决这个难题. 尽管它不仅仅是一个简单的 split() ,它仍然可以在Java 9+中的单个语句中完成: String regex ...

  4. Java将日期拆分成按周或月时间段统计

    /*** 根据传入的参数,来对日期区间进行拆分,返回拆分后的日期List* @param statisticsType* @param map* @return* @throws ParseExcep ...

  5. linux+多个字符分割字符串数组中,String的split()方法可以将字符串按照特定的分隔符拆分成字符串数组...

    在java.lang包中有String.split()方法,返回是一个数组------不管按照什么拆,拆出来是一个数组 String str = "1,2,3,4,5,6"; St ...

  6. java 分析英文段落,查找、统计单词

    目录 题目描述 测试段落 运行效果 用到的方法 题目描述 给定一串字符串(英文段落),用户输入某个单词,求该单词出现的总次数,和出现在第几个位置上. import java.util.*; //主程序 ...

  7. Java如何把一个CSV文件拆分成指定个CSV文件【带源码,完美运行带截图】

    文章目录 一.前言 二.实现 1. 首先进行CSV文件读取,并且把文件组成list,把list拆分 2. 拆分的具体代码如下: 3. 导出到新CSV文件代码如下: 4.测试 5. 结果 一.前言 前段 ...

  8. java xml 拆分_java – 如何使用VTDGenHuge将大型xml拆分成小块?

    我想将大型xml分成小块.我正在使用VTDGen将xml文件拆分成小块,它适用于文件大小< 2 GB. VTD-xml使用IN-Memory来解析xml,我不想将xml加载到内存中.所以我试图使 ...

  9. 《每日一题》842. Split Array into Fibonacci Sequence 将数组拆分成斐波那契序列

    给定一个数字字符串 S,比如 S = "123456579",我们可以将它分成斐波那契式的序列 [123, 456, 579]. 形式上,斐波那契式序列是一个非负整数列表 F,且满 ...

最新文章

  1. 初识片选信号和中断控制器
  2. 【MapBox】5种地图(底图)样式自由切换附源码
  3. 【Spring】使用Spring和AMQP发送接收消息(下)
  4. python多线程编程(8):线程的合并和后台线程
  5. 微型计算机的机箱内硬件系统,计算机硬件系统(教案) 机箱内的秘密
  6. 类加载器ClassLoader
  7. 虚拟机与ubuntu(二):连接访问
  8. 2005计算机编程入门教学,Micro:bit教程05—小bit编程入门教程
  9. Ubuntu代理服务器设置上网
  10. 专业技能与职业素养报告计算机,职业技能与职业素养的心得体会
  11. 屏蔽第三方SDK权限
  12. ChatGPT 火爆“出圈”,谷歌员工慌了!CEO 回应:我们也有,担心声誉才没上
  13. 政策解读|2023法定节假日安排发布了,HR需要跟进的三件事
  14. 非常详细的 navigationController 的使用
  15. webmail 客户端_最受欢迎的Webmail客户端
  16. python修改yaml文件_Python读取yaml文件的详细教程
  17. 得阅读者赢联考:MBA联考不能忽略的英语(二)阅读部分
  18. 黑莓9000和9900哪个好_黑莓9900和9930的区别大剖析【详细介绍】
  19. 安装Oracle10g客户端时出现报错:Error encountered when registering mfc40.dll,please run regsvr32.exe to register
  20. 什么是吉布斯采样(Gibbs Sampling)

热门文章

  1. spring-data-jpa specification 复杂查询之 zuji-jpa
  2. iphone android短信中心号码,iPhone发不了短信(设置短信中心号码)的解决办法
  3. 将爬虫数据存放到数据库中
  4. 麒麟服务器系统磁盘管理之fdisk
  5. lasergrbl调整XYZA各轴电机运动方向
  6. c语言中c为字符型便量,c='97'是否正确,计算机二级C语言 考点06 字符型常量变量...
  7. 犀牛书第七版学习笔记:数据类型与结构-类型转换
  8. 2021-10-22 使用open3d的estimate_normals函数报错AttributeError
  9. XDC文件注释必须要另起一行
  10. SAP 采购订单上含税价实现净价