CoreBiGramTableDictionary.java和CoreDictionary.java结构思路

词典里文件的格式:wordA@wordB     frequency
CoreBiGramTableDictionary.java文件用一个TreeMap<(int)wordA, TreeMap<(int)wordB, (int)frequency>>来读取词典。用一个名为pair的int型数组来存储TreeMap<(int)wordB, (int)frequency>。因为一个wordA可能对应有多个wordB,所以用一个名为start的int型数组来记录wordA后面有多少个wordB(start[i] ~~~ start[i+1])。
wordA和wordB的int数值从DAT的查询中来。
词典里文件的格式:word     nature1     frequency1     nature2     frequency2 ......
CoreDictionary.java里用一个Attribute的内部类来保存词典里的每一列中word后的那些概率。
Attribute属性:Nature nature[];
                        int         frequency[];
                        int          totalFrequency;
接着用一个TreeMap<String, Attribute>来存储一列。
怎么build这个map到DAT里?
build(map<String, Attribute>) --> build(Set<String, Attribute>) --> List<String> keyList, List<Attribute> valueList --> build(keyList, valueList) --> DAT里的Attribute[] v := valueList, 最终到了原有的build()。
OK, finished.

HanLP里使用DAT存取字典的方法相关推荐

  1. python里class转换_python实现class对象转换成json/字典的方法

    python实现class对象转换成json/字典的方法 发布于 2016-03-28 08:05:44 | 153 次阅读 | 评论: 0 | 来源: 网友投递 Python编程语言Python 是 ...

  2. python两个字典合并为一个新字典_Python合并2个字典成1个新字典的方法(9种)

    字典是Python语言中唯一的映射类型. 映射类型对象里哈希值(键,key)和指向的对象(值,value)是一对多的的关系,通常被认为是可变的哈希表. 字典对象是可变的,它是一个容器类型,能存储任意个 ...

  3. dat image 微信_微信有没有把图片dat转为jpg的方法

    微信dat转码软件使用操作说明在线解码,各位同学下载软件后,如何操作?如何找到dat文件?如何使用?又有哪些注意事项呢?这里会为大家一一道来.问题1 :如果下载失败怎么办?请先检查网络,软件并没有放在 ...

  4. 爬虫之requests模块cookieJar对象转换为cookies字典的方法

    爬虫之requests模块cookieJar对象转换为cookies字典的方法 使用requests获取的resposne对象,具有cookies属性.该属性值是一个cookieJar类型,包含了对方 ...

  5. 在字典里添加项_Python 字典(Dictionary)

    字典 字典是无序.可修改的键值对集合.在Python中,字典用大括号包裹. 示例 创建并打印一个字典: thisdict = { "province": "浙江" ...

  6. 解决 android 高低版本 webView 里内容 自适应屏幕的终极方法

    解决 android 高低版本 webView 里内容 自适应屏幕的终极方法 参考文章: (1)解决 android 高低版本 webView 里内容 自适应屏幕的终极方法 (2)https://ww ...

  7. zhlan--Python中的字典遍历方法 字典取值

    一.Python中的字典遍历方法: info = { 'name':'xiaoming', 'sex':'nan', 'age':20, 'id':1} info2 = { 'name':'hhh', ...

  8. php实现小说字典功能_PHP实现获取并生成数据库字典的方法

    本文实例讲述了PHP实现获取并生成数据库字典的方法.分享给大家供大家参考,具体如下: /** * 生成mysql数据字典 */ header("Content-type:text/html; ...

  9. Python 字典 fromkeys()方法

    Python 字典 fromkeys() 方法用于创建一个新的字典,并以可迭代对象中的元素分别作为字典中的键,且所有键对应同一个值,默认为None. fromkeys() 方法语法: 1 dict.f ...

  10. Python列表和字典的方法总结

    列表方法: 方法 说明 append( item ) 在列表末尾插入(item ) count( element ) 返回element在列表中出现的次数 extend( newlist ) 将new ...

最新文章

  1. tomcat部署 修改域名和访问域名时去掉项目名
  2. android MVP模式简介
  3. 提升图像对比度和亮度
  4. Codeforces 913 二进制背包(柠檬水) 暴力贪心特殊背包(选题)
  5. 穿墙透视真的来了!MIT华人团队超强动作检测模型,小黑屋照样夜视
  6. 2021 互联网公司时薪排行榜出炉!微软、美团很不错
  7. Nginx监控数据采集与分析
  8. 查看python的模块和函数帮助文档方法
  9. foxmail删除服务器文件,无法真正删除?Foxmail文件中转站BUG
  10. WinHTTP Web Proxy Auto-Discovery Service 服务处于 停止 状态
  11. 最贵新股没破发,此前弃购7.8个亿,背靠华为的这家半导体公司这么香?
  12. 使用adb命令修改build.prop文件
  13. 小白尝试c++编写飞机大战
  14. 一等公民 二等公民_使您的产品成为一流的公民
  15. 手把手教你用yolov3模型实现目标检测教程(一) - 环境配置
  16. moxa服务器udp协议设定,Moxa Nport串口服务器漏洞全球统计报告(Moxa Nport Vulnerability Global Census Report)...
  17. 公众号第三方平台和微信公众号平台的区别与开发步骤
  18. 一加手机刷第三方Recovery、获取Root权限、刷CM教程
  19. 「超盘云」品牌全新升级为「热度云」,热度星选完成A2轮融资
  20. 从黑洞中拯救量子理论:霍金的终极探索

热门文章

  1. 数据驱动型文化是大数据成功的关键
  2. UserDefault使用
  3. 苹果电脑拷贝文件到u盘很慢_小米最硬核U盘!20g,3.1接口,120MB/S读取速度,可连iphone华为...
  4. python制图一元迭代函数_Python中 生成器、迭代器、闭包、装饰器、元类实例分析...
  5. 封装系统驱动放哪里啊_MPS做一体化电机驱动方案有三大绝招
  6. python导出百万数据到excel_Python 批量插入100万级数据到Excel文件(简洁版)
  7. linux入门、常用命令
  8. webdriver 等待页面加载完成_Python+selenium自动化之等待
  9. mysql 5.6 默认密码_mysql5.6配置及修改密码
  10. zabbix 3.2 mysql_zabbix3.2的server和zabbix-agent2.2怎么监控MySQL的办法