当时我的成绩  阿里天池

原始数据  训练的词向量  模型 代码都在下面这两个链接里 一个完整版 一个不完整版

链接:https://pan.baidu.com/s/1I8l-5f0-IlrSPa3aP6nY2A 
提取码:1111 
复制这段内容后打开百度网盘手机App,操作更方便哦

链接:https://pan.baidu.com/s/1XNaM7fc96aSBi-sML-_vEw 
提取码:1111 
复制这段内容后打开百度网盘手机App,操作更方便哦

from gensim.models import KeyedVectors
from gensim.scripts.glove2word2vec import glove2word2vec
import pandas as pd
import numpy as np
import torch
from torch import nn
import torch.utils.data as data
import torch.nn.functional as F
from torch import tensor
from sklearn.metrics import f1_score
from datetime import datetime
import time #csv数据量的数目测试  一共有20000条
with open("train_set839.csv", 'r') as f: #计算长度hang_count=len(f.readlines())
#     print(hang_count)#先把csv中一个句子拿出来  然后把每个单词去词训练库里面找对应的向量规定对于每个句子矩阵都构建一个2000,300的矩阵。
def hang_vectoes_label(index): # 要读取csv文本第几行的文章数据 会返回一个 列表里面是文章的词向量矩阵和标签值row=df.va

阿里天池学习赛 新闻文本分类相关推荐

  1. 【nlp】天池学习赛-新闻文本分类-深度学习1

    目录 1.FastText 1.1.FastText网络结构 1.2.基于fastText的文本分类 2.word2vec训练词向量及使用 2.1.用jieba对语料进行分词处理 2.2.用LineS ...

  2. 【nlp】天池学习赛-新闻文本分类-机器学习

    目录 1.读取数据 查看句子长度 2.可视化 2.1.新闻的字数分布 2.2.新闻文本类别统计 3.数据分析 3.1.统计每个字符出现的次数 3.2.统计不同字符在句子中出现的次数 4.文本特征提取 ...

  3. 天池 入门赛-新闻文本分类-单个bert模型分数0.961

    文章目录 一些说明 三.最终代码及解析 3.1 构建分词器 3.2 预训练bert模型 3.3 分类任务微调: 零.分词tokenization 1.2 分词规则 1.3 character-base ...

  4. 阿里天池学习赛-金融风控-贷款违约预测

    阿里天池学习赛-金融风控-贷款违约预测 1 赛题理解 1.1 赛题数据 1.2 评测标准 2 探索性分析(EDA) 2.1 初窥数据 2.2 查看缺失值占比 2.3 数值型变量 2.3.1 数据分布 ...

  5. 零基础入门CV--街景字符识别(阿里天池学习赛)

    零基础入门CV–街景字符识别(阿里天池学习赛) 比赛链接传送门:零基础入门CV - 街景字符编码识别-天池大赛-阿里云天池 1.简介 该比赛以SVHN街道字符为赛题数据,数据集报名后可见并可下载,该数 ...

  6. Datawhale组队学习-NLP新闻文本分类-TASK06

    Task6 基于深度学习的文本分类3 基于深度学习的文本分类 学习目标 了解Transformer的原理和基于预训练语言模型(Bert)的词表示 学会Bert的使用,具体包括pretrain和fine ...

  7. Datawhale组队学习-NLP新闻文本分类-TASK05

    Task5 基于深度学习的文本分类2 在上一章节,我们通过FastText快速实现了基于深度学习的文本分类模型,但是这个模型并不是最优的.在本章我们将继续深入. 基于深度学习的文本分类 本章将继续学习 ...

  8. 零基础入门NLP - 天池新闻文本分类Task3笔记

    零基础入门NLP - 天池新闻文本分类 以下以Datawhale与天池举办的新闻文本分类这个NLP赛题做的NLP入门Task2笔记 赛题链接:https://tianchi.aliyun.com/co ...

  9. 阿里云天池 学习赛汇总(教学赛,零基础入门,长期赛)

    [教学赛]数据分析达人赛1:用户情感可视化分析 [教学赛]数据分析达人赛2:产品关联分析 [教学赛]数据分析达人赛3:汽车产品聚类分析 零基础入门语音识别-食物声音识别 零基础入门数据挖掘-心跳信号分 ...

最新文章

  1. 11项重大发布!百度大脑语言与知识技术峰会全程高能
  2. 苹果:高通的“非法行为”损害了整个行业
  3. Python 进阶_生成器 生成器表达式
  4. 机器学习实战教程(四):朴素贝叶斯基础篇之言论过滤器
  5. 基于Ganos百行代码实现亿级矢量空间数据在线可视化
  6. 从0开始学习自动化测试框架cypress(五)总结
  7. Xp下的程序编译成linux,Windows XP下硬盘安装Linux系统
  8. 中台“不火”了,企业数智转型如何破圈?
  9. node ,express框架后台设置跨域操作,路由中间件
  10. 从毛坯房到精装修,阿里云企业IT治理样板间助力云上管控和治理
  11. 理解 Linux 配置文件【转】
  12. 2022年11月份PMP考试是新版教材吗?
  13. 知识类API调用的代码示例合集:驾考题库、ISBN书号查询、万年历查询等
  14. 【原创】黑群晖向白群晖 DS920+ 迁移
  15. Python实现电子词典
  16. matlab 图像加密解密 代码,matlab图像加密解密
  17. a标签去掉下划线_怎么去掉html a超链接下划线
  18. 微信服务号 — 社区卫生服务中心申请
  19. 用ajax进行分页查询
  20. 【php基础入门】小白整理PHP常用的字符串函数使用总结分析(推荐)

热门文章

  1. 和平精英开卖显示服务器异常,和平精英开麦没声音怎么处理 解决方法介绍
  2. 抖音创作全攻略 附下载地址
  3. tar xvf 解压一切格式压缩包
  4. Unity中通过mask组件裁剪出圆形图片,制作出圆形头像
  5. 【Ubuntu】win7+Ubuntu16.04双系统安装与卸载
  6. python移动化测试开发面试
  7. python 语法 tip 知识集合 常更新,以防忘记
  8. 骑行应用开发《三》天气
  9. 试题 算法提高 输出正反三角形
  10. 实验5 使用三层交换机划分VLAN及VLAN互通