Introduction

本仓库主要记录本人对 NLP 相关知识的积累,之前笔记做的很多,考虑到秋招已至, 在复习的过程中, 慢慢将这些知识屡清楚,然后将相关的知识笔记整理成专题,来帮助我更好的复习。

同时,开源出来,希望大家能帮助我补一补相关的技术栈,看看我哪方面比较弱,同时也帮助诸位秋招中的伙伴更好的复习。如果希望一起做的同学,可以联系我, 毕竟一个人做这么多,的确有点难,还好我前期笔记做的比较全。

推荐使用 Typora 编辑器打开, 所见即所得。

Contents

1. 编程语言基础

该文件夹下主要记录 python 和 c++ 的一些语言细节, 毕竟这两大语言是主流,基本是都要会的,目前还在查缺补漏中。

C++面试题

Python 面试题

2. 数学基础

该文件夹下主要记录一些数学相关的知识,包括高数,线性代数,概率论与信息论, 老宋亲身经历,会问到, 目前尚在查缺补漏中。

概率论

高等数学

线性代数

信息论

3. 计算机基础理论知识

这部分内容一般不怎么考,因此,没有把重心放在上面,至少现在几乎没有遇到问这方面的, 有意思的是,投了阿里某部的NLP算法,居然来了个不懂NLP的来面,全程真的瞎聊,全是开发。

4. 机器学习基础

这部分已经开始进入正题了,事实证明,部分大厂会提及一些基础的机器学习算法知识,因此,这部分我觉得几个核心的模型是要会的。

机器学习项目流程

判别模型 vs 生成模型

频率派 vs 贝叶斯派

数据预处理

特征工程

特征工程-关联规

模型 - SVM

模型 - 聚类算法

模型 - 决策树

模型 - 逻辑回归

模型 - 朴素贝叶斯

模型 - 随机森林

模型 - 线性回归

5. 深度学习基础

这部分主要讲述深度学习方面的基础知识,是核心点,但很多情况下,很多面试官的题基本差不多,不过我个人觉得,有这种全局的,全面的知识框架是有益的。

深度学习项目流程

5.1 基础理论部分

基础理论 - 多任务学习

基础理论 - 集成学习

基础理论 - 分类问题评估指标

基础理论 - 距离度量方法

基础理论 - 目标函数,损失函数,代价函数

基础理论 - 偏差 vs 方差,欠拟合 vs 过拟合

基础理论 - 数据角度看深度学习

基础理论 - 梯度消失,梯度爆炸问题

基础理论 - 维数灾难问题

基础理论 - 指数加权平均

基础理论- 局部最小值,鞍点

基础理论 - 集成学习

基础理论 - 集成学习

5.2 基本单元

基本单元 - CNN

基本单元 - MLP

基本单元 - RNN

5.3 调参相关

调参 - 超参数调优

调参 - 激活函数

调参 - 权重初始化方案

调参 - 优化算法

5.4 Tricks

Trick - Dropout

Trick - Normalization

Trick - 融合训练集,验证集,测试集

Trick - 提前终止

Trick - 学习率衰减

Trick - 正则化

6. 统计自然语言处理

这部分前期的笔记做的不多,因此还没怎么开始。

7. 深度学习自然语言处理

这部分算是核心的知识了,这部分还需要逐渐完善,时间有点紧啊。

文本数据预处理

各大任务的评价指标

改进 NLP 模型的一些思路

7.1 词向量三部曲

词向量 - Word2Vec

词向量 - Glove

词向量 - FastText

7.2 预训练语言模型

预训练语言模型 - BERT改进研究

预训练语言模型 - 融入知识图谱

预训练语言模型 - 自然语言生成

7.3 Attention 机制

7.4 文本分类

7.5 语义匹配

7.6 阅读理解

8. 源码阅读

这部分主要推荐一些自己阅读过的一些源码,有些源码是 NLP 相关, 有些是深度学习相关的,部分源码我个人有做注释,会相应的列出来。

9 . 老宋渣渣算法面经

这部分主要是自己面试过程中的一些感悟, 哎, 快面到自闭了。

Reference

[1] DeepLearning-500-questions -- 一个很好的仓库

[2] Algorithm_Interview_Notes-Chinese -- 知识比较旧了,但也很好

其他主要是自己的日常积累和看的论文。

自然语言处理算法工程师笔试题目_NLPer-Interview - NLP 算法工程师相关的面试题...相关推荐

  1. 【阅文集团2020秋招10.21笔试题目】机器学习/NLP算法工程师

    一.试题分布: 10道单选题 10道多选题 3道问答题 1道编程题 1道压轴题 题目难度评价:整体难度偏基础,考察知识点很全面,涉及到数据库,java,操作系统,概率论,深度学习基础等等. 二.题目回 ...

  2. 小米嵌入式软件工程师笔试题目解析

    今天分享的是小米的嵌入式软件开发工程师的笔试题目.这份题目很奇怪,操作系统,数据结构,网络基础,Java,C++,数据库,正则表达式,Linux都考到了.当时做题的时候,我都怀疑发错卷子了...还好最 ...

  3. 单片机工程师笔试题目归纳汇总

    基础知识 波特率 1)定义: 波特率表示每秒钟传送的码元符号的个数,是衡量数据传送速率的指标,它用单位时间内载波调制状态改变的次数来表示.   在信息传输通道中,携带数据信息的信号单元叫码元,每秒钟通 ...

  4. 北京联发科嵌入式软件工程师笔试题目解析

    最近在写大论文,头都要秃了,技术文章也更不动了.去年参加秋招的时候,记录了一些笔试题目,今天整理了下答案,供大家参考.最近几周,我都会发一些大厂笔试的题目和答案.今天分享的是北京联发科提前批嵌入式软件 ...

  5. 2015年CVTE校园招聘--Web后台服务开发工程师笔试题目及参考答案

    Web后台服务开发工程师笔试题目及参考答案 笔试时间:2014.09.14 地点: 广工 1.编程题:输入一串数字,返回查询数值的数组下标 解答:public static void main(Str ...

  6. 计算机四级网络工程师题目,计算机四级网络工程师笔试题目

    欢迎需要靠计算机四级网络工程师的朋友,来练一练下面分享的这份笔试题目. (总分100, 考试时间120分钟) 一.选择题(每小题1分,共40分) 1. 下列关于RPR技术的描述中,错误的是 A RPR ...

  7. 兆易创新嵌入式软件工程师笔试题目解析

    哈喽,大家好.今天分享的是兆易创新的嵌入式软件开发工程师的笔试题目.这份题目中等难度,考察基础知识的偏多,最后的编程题只考了一个结构体数组的初始化.所以,在准备校招时,将重点还是要放在基础知识上.下面 ...

  8. 自然语言处理算法工程师笔试题目_NLP算法工程师(实习生)面试总结(持续更新)...

    爱奇艺 1. attention<attention is all you need> 2. 相关项目 3. 逻辑回归 4. linux的指令(重命名文件,vim替换,vim指向文章最末行 ...

  9. 计算机视觉算法工程师 笔试,深度学习算法工程师笔试题目

    AI开发平台ModelArts ModelArts是面向开发者的一站式AI开发平台,为机器学习与深度学习提供海量数据预处理及半自动化标注.大规模分布式Training.自动化模型生成,及端-边-云模型 ...

最新文章

  1. 3、编写一个prod()函数,可以接受一个list并利用reduce()求积
  2. BZOJ 1968 [Ahoi2005]COMMON 约数研究
  3. python编_python编
  4. [css] 如何重写行内样式?方法有哪些(至少两种)?
  5. 苹果电脑删除软件_5款Mac查杀恶意流氓软件,防护你的MacOS电脑,随时清理优化更加安全!...
  6. jxl freemark
  7. windows黑客编程系列(一):运行单一实例
  8. 实战分享声卡效果调试都用那些效果器插件
  9. 数据开放接口第一弹:12306官网中全国火车站数据
  10. 执行oracle 函数,oracle 函数function语法及简单实例
  11. 欲为苍鹰,勿与鸟鸣, 欲为强者,莫与弱争!
  12. 免流服务器系统怎么选,免流云服务器选
  13. c语言1 qnan,什么是 1.#QNAN?
  14. 杀不死的人狼——我读《人月神话》(三)
  15. 如何提高selenium脚本的执行速度
  16. pair用法(给元素赋值)
  17. Flask之钩子函数
  18. 制作U盘启动CDLinux
  19. iBatis框架batch处理优化
  20. java代码混淆器proguard使用大法3种

热门文章

  1. UG/NX 二次开发(C#) 自动刻字三部曲3-布尔求差
  2. livox的一些使用
  3. 为你的 Blog 添加“天气预报”功能。
  4. 你正在为互联网上的“免费”付出什么?
  5. PI数据库的应用、管理和定位
  6. php 将一个字符串分割为数组
  7. 委内瑞拉大规模停电关注工控和物联网安全
  8. JUC系列二:Lock接口
  9. java用方法重载就圆的面积,java中重载怎么写
  10. 机器学习中常用的基本概念