前言

Label Studio是一个非常好用的开源数据标注工具,拥有对包括音频、文本、图片、视频和时间序列等各种数据类型的标注能力,有简单易用的UI设计和多导出格式的支持,能够有利于数据准备和利用已有训练数据提升机器学习模型精度。

本文内容简要介绍如何在label-studio中批量上传本地数据。

实现

当我们希望在label-studio中批量上传本地数据时,可以通过将本地数据以http服务的方式暴露给label-studio访问。

以下以Ubuntu系统为例进行说明。

将本地数据(如待批量导入的图片)放在运行label-studio服务的远程机器上的某个路径(例如/data/dataset/),新增一个批量导入的脚本:

# 切到python的label_studio包路径下
cd /data/miniconda3/lib/python3.7/site-packages/label_studio
# 新增sh脚本
vi serve_local_files.sh

添加以下内容:

#!/usr/bin/env bashINPUT_DIR=$1WILDCARD=${2}OUTPUT_FILE=${3:-"files.txt"}PORT=${4:-8081}echo "Usage: sh serve_local_files.sh INPUT_DIR WILDCARD OUTPUT_FILE PORT"echo "This script scans INPUT_DIR directory with WILDCARD filter [all files by default],"echo "generates OUTPUT_FILE [files.txt by default] with a file list,"echo "starts web server on the port PORT [8081 by default] that serves files from INPUT_DIR"echoecho "Scanning ${INPUT_DIR} ..."FIND_CMD="find ${INPUT_DIR} -type f"if [ -z "$WILDCARD" ]; thenecho "Files wildcard is not set. Serve all files in ${INPUT_DIR}..."elseFIND_CMD="${FIND_CMD} -name ${WILDCARD}"fiecho "Replacing ${INPUT_DIR} to http://localhost:${PORT} ..."INPUT_DIR_ESCAPED=$(printf '%s\n' "$INPUT_DIR" | sed -e 's/[\/&]/\\&/g')eval $FIND_CMD | sed "/${INPUT_DIR_ESCAPED}/s//http:\/\/localhost:${PORT}/" > $OUTPUT_FILEgreen=`tput setaf 2`reset=`tput sgr0`echo "${green}File list stored in '${OUTPUT_FILE}'. Now import it directly from Label Studio UI${reset}"echo "Running web server on the port ${PORT}"cd $INPUT_DIRpython3 -m http.server $PORT

执行导入脚本:

bash serve_local_files.sh /data/dataset/  *.jpg  files.txt 8082

关于参数支持可见脚本内容和参考资料[3]。

执行后在/data/miniconda3/lib/python3.7/site-packages/label_studio路径下会生成files.txt文件。

将生成的files.txt下载到本机上并将files.txt文件中的localhost批量替换为远程机器的实际ip

在label-studio服务的网页中,在新建project中使用import功能上传files.txt文件。即可正常访问批量导入的数据。

版权说明

本文为原创文章,独家发布在blog.csdn.net/TracelessLe。未经个人允许不得转载。如需帮助请email至tracelessle@163.com或扫描个人介绍栏二维码咨询。

参考资料

[1] heartexlabs/label-studio: Label Studio is a multi-type data labeling and annotation tool with standardized output format
[2] Label Studio – Open Source Data Labeling
[3] Label Studio Documentation — Import Data into Label Studio
[4] label-studio/serve_local_files.sh at master · heartexlabs/label-studio

label-studio批量上传本地数据相关推荐

  1. 个人永久性免费-Excel催化剂功能第102波-批量上传本地图片至网络图床(外网可访问)...

    自我突破,在100+功能后,再做有质量的功能,非常不易,相对录制视频这些轻松活,还是按捺不住去写代码,此功能虽小,但功课也做了不少,希望对真正有需要的群体带来一些惊喜. 背景介绍 图床的使用,一般是写 ...

  2. Thinkphp5+PHPExcel实现批量上传表格数据

    1.首先要下载PHPExcel放到vendor文件夹下,我的路径是:项目/vendor/PHPExcel/,把下载的PHPExcel文件放在这里 2.前端代码 <!DOCTYPE html> ...

  3. 向腾讯云windows服务器传输文件,如何上传本地文件到腾讯云Windows服务器上?

    在做运维的过程中经常遇见客户问,如何上传本地数据到Windows云服务器上. 相对Linux云服务器,针对新人朋友Windows云服务器是可视化的更加容易理解.云服务器就是我们租用了腾讯云机房的一台服 ...

  4. Android 本地tomcat服务器接收处理手机上传的数据之案例演示

    上一篇:Android 本地tomcat服务器接收处理手机上传的数据之环境搭建     本篇基于上一篇搭建的服务器端环境,具体介绍Android真机上传数据到tomcat服务器的交互过程   场景:A ...

  5. vscode/typora+picGo-core(命令行CLI)/picGo(GUI)+图片上传(github/smms)/批量上传/typora语法扩展渲染功能设置/修改本地图片存放位置配置

    文章目录 typora&vscode 性能对比(渲染速度) picgo_GUI中文环境 GUI data.json 总体配置文件 命令行任意环境 安装picgo-commandLine 配置文 ...

  6. 用ECSHOP增强工具把淘宝数据包批量上传到自己的ECSHOP独立网店

    www.shopfw.net 用ECSHOP增强工具把淘宝数据包批量上传到自己的ECSHOP独立网店.完整保留商品的颜色.尺码.库存.货号.重量.首页图.详情图.商品描述.扩展属性等信息.对于网店中缺 ...

  7. 用SHOPEX增强工具把淘宝数据包批量上传到自己的ShopEX独立网店

    用SHOPEX增强工具把淘宝数据包批量上传到自己的ShopEX独立网店.完整保留商品的颜色.尺码.库存.货号.重量.首页图.详情图.商品描述.扩展属性等信息.对于网店中缺少的规格,软件会自动添加,无需 ...

  8. php七牛云批量上传,七牛云——批量将本地图片上传到七牛云

    前言 在本地大概有10w左右的头像图片,打算批量上传到七牛云,寻找后发现了一个神奇的官方工具,十分的好用 工具 资源批量上传和多文件上传 我这里上传本地用的是QsunSync QsunSync Git ...

  9. Word数据批量上传

    Word数据批量上传 这里我们实现把大量的数据从Excel中移动显示在网页上,实现一个数据批量上传. 页面这里我们这里是一个点击事件,触发文件选择页面点击事件,进入选择页面,选择文件就触发input标 ...

最新文章

  1. Drawable Resource 之旅(一):BitmapDrawable 详解
  2. 重温强化学习之强化学习简介
  3. java.lang.UnsupportedClassVersionError解决方案
  4. LwIP应用开发笔记之四:LwIP无操作系统TFTP服务器
  5. 南京航空航天大学计算机网课,南京航空航天大学课程教学大纲-南京航空航天大学计算机科学与技术(9页)-原创力文档...
  6. 三个常用c++11特性
  7. python常用的库与包_python常用到哪些库?
  8. ListT to DataTable
  9. javascript获取css样式文件中定义的样式的方法
  10. 计算机系制作网页,613331-付军科-计算机系网页设计与制作实训报告【荐】.doc
  11. W5500调试的部分问题和注意点
  12. 惠威T200B刷机 Q群
  13. C1能力认证训练题解析 _ 第一部分 _ 计算机通识
  14. Java实现动态规划经典题目
  15. eclipse快捷键总结
  16. c语言 函数调用顺序,C++函数定义和调用过程(超详细)
  17. 王者荣耀是如何从C++代码变到游戏的?
  18. 【模拟电子技术基础】本章讨论问题答案1
  19. SQL Server Intergration Services(SSIS)
  20. ScriptX.cab与Smsx.cab打印代码

热门文章

  1. outlook自定义快捷键_如何将名片模板应用于联系人并在Outlook 2013中对其进行自定义...
  2. Java平滑处理什么意思_photoshop画笔选项里的“平滑”到底是什么意思?
  3. ISO27701个人隐私信息安全管理体系 认证经验
  4. Vegas和Pr哪个好?看完这篇你就明白了
  5. Python的五大奇淫技巧,带你掌握高效编程技巧的充实感
  6. 【电影推荐】60部经典华语电影,排行不分先后!
  7. MySql基础篇---001 数据库概述与MySQL安装篇:概述,表和类对应关系,表关系、数据库卸载,下载,安装,配置,启动,登录,演示,图形化工具,目录结构,常见问题
  8. Web用户体验设计提升实践
  9. TCP/IP详解第一卷第一章重点摘要
  10. 小册上新 | 如何使用掘金社区