目录

0.BOT的认识

1.需求分析和流程介绍

1.1 需求分析

1.2 效果演示

1.3 实现流程

1.3.1 整体架构

1.3.2 闲聊模型

1.3.3 问答模型

2.环境准备

2.1 Anaconda环境准备

2.2 fasttext安装

2.3 pysparnn安装

3.语料准备

3.1 分词词典

3.1.1 词典来源

3.1.2 词典处理

3.1.3 对多个词典文件内容进行合并

3.2 准备停用词

3.2.1 什么是停用词

3.2.2 停用词的准备

3.2.3 手动筛选和合并

3.3 问答对的准备

3.3.1 现有问答对的样式

3.3.2 excel中问答对的处理

3.4 相似问答对的采集

3.4.1 采集相似问答对的目的

3.4.2 手动构造数据

4.文本分词

4.1 准备词典和停用词

4.1.1 准备词典

4.1.2 准备停用词

4.2 准备按照单个字切分句子的方法

4.3 完成分词方法的封装


0.BOT的认识

我的上篇文章链接: (6条消息) 10-走进聊天机器人_我行我素,向往自由的博客-CSDN博客

1.需求分析和流程介绍

1.1 需求分析

1.2 效果演示

1.3 实现流程

1.3.1 整体架构

1.3.2 闲聊模型

1.3.3 问答模型

2.环境准备

2.1 Anaconda环境准备

2.2 fasttext安装

2.3 pysparnn安装

3.语料准备

3.1 分词词典

3.1.1 词典来源

3.1.2 词典处理

3.1.3 对多个词典文件内容进行合并

下载使用不同平台的多个词典之后,把所有的txt文件合并到一起供之后使用。

3.2 准备停用词

3.2.1 什么是停用词

对句子进行分词之后,句子中不重要的词。

3.2.2 停用词的准备

3.2.3 手动筛选和合并

3.3 问答对的准备

3.3.1 现有问答对的样式

3.3.2 excel中问答对的处理

3.4 相似问答对的采集

3.4.1 采集相似问答对的目的

上面采集的数据套存在部分噪声,部分问题搜索到的结果语义上并不是太相似。

3.4.2 手动构造数据

根据前面的问答对的内容,把问题大致分为了若干类型,对不同类型的问题设计模板,然后构造问题,问题模块如下:

4.文本分词

4.1 准备词典和停用词

4.1.1 准备词典

4.1.2 准备停用词

4.2 准备按照单个字切分句子的方法

4.3 完成分词方法的封装

lib下创建cut_sentence.py文件,完成分词方法的构建:

11-聊天机器人项目准备相关推荐

  1. 聊天机器人-项目准备

    聊天机器人-项目准备 文章目录 聊天机器人-项目准备 走进聊天机器人 学习目标 1. 目前企业中的常见的聊天机器人 2. 常见的聊天机器人怎么实现的 2.1 问答机器人的常见实现手段 2.2 任务机器 ...

  2. Rasa 中文聊天机器人项目

    Rasa 中文聊天机器人项目 RASA 开发中文指南系列博文: Rasa中文聊天机器人开发指南(1):入门篇 Rasa中文聊天机器人开发指南(2):NLU篇 Rasa中文聊天机器人开发指南(3):Co ...

  3. 自动聊天机器人项目班

    打造传统NLP聊天机器人 第1课 聊天机器人的基础模型与综述 知识点1:行业与业界综述 实战项目:最简单的Rule-Base聊天机器人 第2课 NLP基础及扫盲 知识点1:NLP基本算法 实战项目:经 ...

  4. 基于pytorch的聊天机器人项目

    写一个闲聊式的聊天机器人,类似微软小冰 代码见 https://github.com/skyerhxx/Chatbot 环境 pytorch1.3 python3.7 cuda10.1 注意pytor ...

  5. 目前最新《自动聊天机器人项目班 [一门课搞定聊天机器人]》

    .打造传统NLP聊天机器人 第1课 聊天机器人的基础模型与综述 知识点1:行业与业界综述 实战项目:最简单的Rule-Base聊天机器人 第2课 NLP基础及扫盲 知识点1:NLP基本算法 实战项目: ...

  6. 【PyTorch】11 聊天机器人实战——Cornell Movie-Dialogs Corpus电影剧本数据集处理、利用Global attention实现Seq2Seq模型

    聊天机器人教程 1. 下载数据文件 2. 加载和预处理数据 2.1 创建格式化数据文件 2.2 加载和清洗数据 3.为模型准备数据 4.定义模型 4.1 Seq2Seq模型 4.2 编码器 4.3 解 ...

  7. 软工实践团队项目-智能聊天机器人简介

    "智能聊天机器人"项目 目前已确定的团队人员:张扬.俊彦.韫月.地秀.泽波.李翔.文婧.俞明.加伟(排名不分先后) 队伍已满,没有再招人的打算(#^.^#) 我们的想法 你有用过智 ...

  8. 聊天机器人框架Rasa资源整理

      Rasa是一个主流的构建对话机器人的开源框架,它的优点是几乎覆盖了对话系统的所有功能,并且每个模块都有很好的可扩展性.参考文献收集了一些Rasa相关的开源项目和优质文章. 一.Rasa介绍 1.R ...

  9. chatbot聊天机器人技术路线

    聊天机器人实现的技术途径大约可分为以下4种: (其中第一种是属于"调用第三方API",也就是说核心代码和数据库不掌握在自己手里)(第二.三.四种属于开源框架,也就是说我们可以下载其 ...

  10. 转载:chatbot聊天机器人技术路线

    转载&备份: https://blog.csdn.net/tian_panda/article/details/80664578 聊天机器人实现的技术途径大约可分为以下4种: (其中第一种是属 ...

最新文章

  1. 如何用Python画一棵漂亮的树
  2. Oracle在Linux平台“静默”安装(二)
  3. One sentence only!!
  4. android 中间凹背景_Android 华为凹口屏适配小结
  5. 如何给 SAP Fiori Elements 应用的字段添加 value help
  6. mysql sayhello的函数_Euphoria 函数
  7. 作者:​惠丹(1991-),男,兰州大学资源环境学院硕士生。
  8. WPF Multi-Touch 开发:Windows 7 安装多点触屏模拟器
  9. C语言,编写函数exchangeMaxMin(int arr[],int n),将该数组中最大最小值交换位置;
  10. mysql orderitems_【Mysql】教程全解(三)ORDER BY 排序
  11. C#-求int数组中连续偶数列的个数
  12. [转]C++编译链接过程详解
  13. 如何在Word里打出带圈的数字?
  14. 划重点 2022面试必刷461道大厂架构面试真题汇总+面经+简历模板
  15. Windows文件搜索软件Everything
  16. ios中SQLite3的基本操作
  17. 为何用户体验无法被设计,如何为用户体验设计
  18. Android 8.0 华为手机 桌面应用图标显示圆形适配方案
  19. DDOS攻击 — 棋牌游戏创业公司的生死劫
  20. 我们来找茬外挂思路之一

热门文章

  1. 当一个程序员表情夸张,双手在键盘上疯狂敲击,你真的以为是在敲代码!!?
  2. IT届人士的各种女人
  3. jquery-美女相册案例
  4. File Browser配置安装
  5. 洛谷 B3618 寻找团伙
  6. 瑞星:“007小游戏论坛”、“2144小游戏”等网站被挂马
  7. 使用Emacs Org制作PDF文档
  8. [cnblogs镜像]GFM(GitHub Flavored Markdown)与标准Markdown的区别
  9. 英文歌曲:because of you(因为你)
  10. supervisor /usr/lib64/python2.7/socket.py line: 224