simpletransformers的 single sentence classification和sentence pair classification

simpletransformers
simple-transformers-configuration

1. 导入相关模块

import warnings
warnings.simplefilter('ignore')import gc
import osimport numpy as np
import pandas as pdfrom sklearn.model_selection import StratifiedKFoldfrom simpletransformers.classification import ClassificationModel, ClassificationArgsos.environ["CUDA_DEVICE_ORDER"]="PCI_BUS_ID"
os.environ['CUDA_VISIBLE_DEVICES'] = '3'

2. 读取数据，并处理空值


train = pd.read_csv('data/train.csv')
test = pd.read_csv('data/test.csv')train['content'].fillna('', inplace=True)
test['content'].fillna('', inplace=True)

3. 设置模型的参数

TransformerModel具有dict参数，其中包含许多属性，这些属性提供对超参数的控制。

def get_model_args():model_args = ClassificationArgs()model_args.max_seq_length = 32 # 截取文本长度为128model_args.train_batch_size = 16model_args.num_train_epochs = 1 # 跑1epochmodel_args.sliding_window=True     # 使用滑动窗口model_args.evaluate_during_training = True # 训练过程中做评估model_args.evaluate_during_training_verbose = Truemodel_args.fp16 = Falsemodel_args.no_save = True # 不保存模型model_args.save_steps = -1 # 不根据step保存检查点model_args.overwrite_output_dir = True # 覆盖输出路径model_args.output_dir = dir    # 模型输出路径，默认为/outputsreturn model_args

4. single sentence classification 交叉验证训练模型

4.1 load标准预训练模型：huggingface标准预训练模型

model = ClassificationModel("roberta", "roberta-base"
)

4.2 load社区预训练模型社区预训练模型

model = ClassificationModel("bert", "KB/bert-base-swedish-cased"
)

4.3 load本地预训练模型

outputs/best_model为本地保存模型的路径。

model = ClassificationModel("bert", "outputs/best_model"
)

4.4 完整交叉验证代码

oof = []
prediction = test[['id']]
prediction['bert_pred'] = 0n_folds = 3
kfold = StratifiedKFold(n_splits=n_folds, shuffle=True, random_state=2021)
for fold_id, (trn_idx, val_idx) in enumerate(kfold.split(train, train['label'])):train_df = train.iloc[trn_idx][['content', 'label']]valid_df = train.iloc[val_idx][['content', 'label']]train_df.columns = ['text', 'label']valid_df.columns = ['text', 'label']model_args = get_model_args()model = ClassificationModel('bert','hfl/chinese-roberta-wwm-ext',# 中文文本train的社区预训练模型args=model_args)model.train_model(train_df, eval_df=valid_df)#result, vaild_outputs, wrong_predictions = model.eval_model(valid_df)# 这里的result输出一些acc，f1之类的指标# vaild_outputs 输出的是softmax之前的那个权重# wrong_predictions 输出的错误的predict_, vaild_outputs, _  = model.eval_model(valid_df)df_oof = train.iloc[val_idx][['id', 'label']].copy()df_oof['bert_pred'] = vaild_outputs[:,1]oof.append(df_oof)print('predict')_, test_outputs = model.predict([text for text in test['content']])prediction['bert_pred'] += test_outputs[:, 1] / kfold.n_splitsdel model, train_df, valid_df, vaild_outputs, test_outputsgc.collect()

不同任务所对应的模型

Task	Model
Binary and multi-class text classification	`ClassificationModel`
Conversational AI (chatbot training)	`ConvAIModel`
Language generation	`LanguageGenerationModel`
Language model training/fine-tuning	`LanguageModelingModel`
Multi-label text classification	`MultiLabelClassificationModel`
Multi-modal classification (text and image data combined)	`MultiModalClassificationModel`
Named entity recognition	`NERModel`
Question answering	`QuestionAnsweringModel`
Regression	`ClassificationModel`
Sentence-pair classification	`ClassificationModel`
Text Representation Generation	`RepresentationModel`
Document Retrieval	`RetrievalModel`

4.5 输出

df_oof = pd.concat(oof)
df_oof = df_oof.sort_values(by='id')
df_oof.head(10)

df_oof[['id', 'bert_pred']].to_csv('roberta_pred_oof.csv', index=False)
prediction[['id', 'bert_pred']].to_csv('roberta_pred_test.csv', index=False)

5. sentence pair classification 交叉验证训练模型

def get_model_args():model_args = ClassificationArgs()model_args.max_seq_length = 32 # 截取文本长度为128model_args.train_batch_size = 16model_args.num_train_epochs = 1 # 跑1epochmodel_args.sliding_window=True     # 使用滑动窗口model_args.evaluate_during_training = True # 训练过程中做评估model_args.evaluate_during_training_verbose = Truemodel_args.fp16 = Falsemodel_args.no_save = True # 不保存模型model_args.save_steps = -1 # 不根据step保存检查点model_args.overwrite_output_dir = True # 覆盖输出路径model_args.output_dir = dir    # 模型输出路径，默认为/outputsreturn model_args

oof = []
prediction = test[['id']]
prediction['bert_pred'] = 0n_folds = 3
kfold = StratifiedKFold(n_splits=n_folds, shuffle=True, random_state=2021)
for fold_id, (trn_idx, val_idx) in enumerate(kfold.split(train, train['label'])):train_df = train.iloc[trn_idx][['level_4', 'content', 'label']]valid_df = train.iloc[val_idx][['level_4', 'content', 'label']]train_df.columns = ['text_a', 'text_b', 'label']valid_df.columns = ['text_a', 'text_b', 'label']model_args = get_model_args()model = ClassificationModel('bert','hfl/chinese-roberta-wwm-ext',# 中文文本train的社区预训练模型num_labels=2,args=model_args)model.train_model(train_df, eval_df=valid_df)#result, vaild_outputs, wrong_predictions = model.eval_model(valid_df)# 这里的result输出一些acc，f1之类的指标# vaild_outputs 输出的是softmax之前的那个权重# wrong_predictions 输出的错误的predict_, vaild_outputs, _  = model.eval_model(valid_df)df_oof = train.iloc[val_idx][['id', 'label']].copy()df_oof['bert_pred'] = vaild_outputs[:,1]oof.append(df_oof)print('predict')_, test_outputs = model.predict([list(text) for text in test[['level_4', 'content']].values])prediction['bert_pred'] += test_outputs[:, 1] / kfold.n_splitsdel model, train_df, valid_df, vaild_outputs, test_outputsgc.collect()

df_oof = pd.concat(oof)
df_oof = df_oof.sort_values(by='id')
df_oof.head(10)

df_oof[['id', 'bert_pred']].to_csv('roberta_pred_oof.csv', index=False)
prediction[['id', 'bert_pred']].to_csv('roberta_pred_test.csv', index=False)

6. sentence-transformers

获取文本相关性

直接使用预训练模型，获取文本相关性
使用训练样本微调之后，获取文本相关性

import numpy as np
import torch
from sentence_transformers import SentenceTransformer, util

simpletransformers的 single sentence classification和sentence pair classification相关推荐

Convolutional Neural Networks for Sentence Classification(卷积神经网络句子分类）
目录摘要原文翻译单词解释技术解读引言原文翻译单词解释技术解读原文翻译单词解释技术解读原文翻译单词解释技术解读原文翻译单词解释技术解读. Model 原文单 ...
文献阅读笔记 # Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks
<Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks> 用于快速搭建NLP任务的demo的开源项目sbert的原始 ...
Chinese Relation Extraction by BiGRU with Character and Sentence Attentions之代码理解
代码链接为 https://github.com/crownpku/Information-Extraction-Chinese/tree/master/RE_BGRU_2ATT . 1. ini ...
java sentence_Java Sentence類代碼示例
本文整理匯總了Java中aima.core.logic.propositional.parsing.ast.Sentence類的典型用法代碼示例.如果您正苦於以下問題:Java Sentence類的具 ...
Tokenisation word segmentation sentence segmentation
David D. Palmer Chapter 2: Tokenisation and SentenceSegmentation.2000 https://scholar.google.com/cit ...
CGMH: Constrained Sentence Generation by Metropolis-Hastings Sampling
Abstract 在自然语言生成的实际应用中,除了流畅度和自然度的要求外,通常还有一些其他的约束. 已有的一些语言生成技术基于 RNN 实现,对于这类方法,不容易在维持生成质量的同时对其添加约束. 文 ...
专题-句向量（Sentence Embedding）
原始地址:https://github.com/imhuay/Algorithm_Interview_Notes-Chinese/blob/master/B-%E8%87%AA%E7%84%B6%E8 ...
simple sentence to complex
目录 terms to note 1 loose sentence 2 periodic sentence圆周句.掉尾句 writing concise sentence how to write c ...
Hierarchical Attention Networks for Document Classification(HAN)
HAN历史意义: 1.基于Attention的文本分类模型得到了很多关注 2.通过层次处理长文档的方式逐渐流行 3.推动了注意力机制在非Seqseq模型上的应用前人主要忽视的问题: 1.文档中不同句 ...

simpletransformers的 single sentence classification和sentence pair classification

1. 导入相关模块

2. 读取数据，并处理空值

3. 设置模型的参数

4. single sentence classification 交叉验证训练模型

4.1 load标准预训练模型：huggingface标准预训练模型

4.2 load社区预训练模型社区预训练模型

4.3 load本地预训练模型

4.4 完整交叉验证代码

4.5 输出

5. sentence pair classification 交叉验证训练模型

6. sentence-transformers

simpletransformers的 single sentence classification和sentence pair classification相关推荐

最新文章

热门文章

simpletransformers的 single sentence classification和sentence pair classification

1. 导入相关模块

2. 读取数据，并处理空值

3. 设置模型的参数

4. single sentence classification 交叉验证训练模型

4.1 load标准预训练模型：huggingface标准预训练模型

4.2 load社区预训练模型 社区预训练模型

4.3 load本地预训练模型

4.4 完整交叉验证代码

4.5 输出

5. sentence pair classification 交叉验证训练模型

6. sentence-transformers

simpletransformers的 single sentence classification和sentence pair classification相关推荐

最新文章

热门文章

4.2 load社区预训练模型社区预训练模型