一、赛题数据

遥感技术已成为获取地表覆盖信息最为行之有效的手段,遥感技术已经成功应用于地表覆盖检测、植 被面积检测和建筑物检测任务。本赛题使用航拍数据,需要完成地表建筑物识别,将地表航拍图像素划分为有建筑物和无建筑物两类。
如下图,左边为原始航拍图,右边为对应建筑物标注。

二、数据标签

赛题为语义分割任务,因此具体的标签为图像像素类别。在赛题数据中像素属
于2类(无建筑物和有建筑物),因此标签为有建筑物的像素。赛题原始图片为
jpg格式,标签为RLE编码的字符串。
**RLE全称(run-length encoding)**,翻译为游程编码或行程长度编码,
对连续的黑、白像素以不同的码字进行编码。RLE是一种简单的非破坏性资料
压缩发,经常在语义分割比赛中对标签进行编码。RLE与图片之间的转换如下:
import numpy as np
import pandas as pd
import cv2# 将图片编码为rle格式
def rle_encode(im):'''im: numpy array, 1 - mask, 0 - backgroundReturns run length as string formated'''pixels = im.flatten(order = 'F')pixels = np.concatenate([[0], pixels, [0]])runs = np.where(pixels[1:] != pixels[:-1])[0] + 1runs[1::2] -= runs[::2]return ' '.join(str(x) for x in runs)# 将rle格式进行解码为图片
def rle_decode(mask_rle, shape=(512, 512)):'''mask_rle: run-length as string formated (start length)shape: (height,width) of array to return Returns numpy array, 1 - mask, 0 - background'''s = mask_rle.split()starts, lengths = [np.asarray(x, dtype=int) for x in (s[0:][::2], s[1:][::2])]starts -= 1ends = starts + lengthsimg = np.zeros(shape[0]*shape[1], dtype=np.uint8)for lo, hi in zip(starts, ends):img[lo:hi] = 1return img.reshape(shape, order='F')

三、评价指标

 赛题使用Dice coefficient来衡量选手结果与真实标签的差异性,Dice coefficient可以按像素差异性来比较结果的差异性。Dice coefficient的具体计算方式如下:(2 ∗ |X ∩ Y |) / (|X| + |Y |)其中X是预测结果,Y为真是标签的结果。当X与Y完全相同时,Dice coefficient为1,排行榜使用所有测试集图片的平均Dice coefficient来衡量,分数值越大越好。

四、读取数据

FileName Size
test_a.zip 314.49MB
test_a_samplesubmit.c.sv 46.39KB
train.zip 3.68GB
train_mask,csv.zip 97.52MB

具体数据读取案例

import pandas as pd
import cv2
train_mask = pd.read_csv('train_mask.csv', sep='\t', names=['name', 'mask'])# 读取第一张图,并将对于的rle解码为mask矩阵
img = cv2.imread('train/'+ train_mask['name'].iloc[0])
mask = rle_decode(train_mask['mask'].iloc[0])print(rle_encode(mask) == train_mask['mask'].iloc[0])
# 结果为True

五、解题思路

由于本次赛题是一个典型的语义分割任务,因此可以直接使用语义分割的模型
来完成
  1. 步骤1:使用FCN模型模型跑通具体模型训练过程,并对结果进行预测提交;
  2. 步骤2:在现有基础上加入数据扩增方法,并划分验证集以监督模型精度;
  3. 步骤3:使用更加强大模型结构(如Unet和PSPNet)或尺寸更大的输入完成训练;
  4. 步骤4:训练多个模型完成模型集成操作;

天池比赛之城市建筑识别-赛题理解相关推荐

  1. 天池大赛-心跳信号分类预测:赛题理解与baseline解析

    比赛地址:零基础入门数据挖掘-心跳信号分类预测 参考资料:由DataWhale开源的学习资料 1. 赛题简介 本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事 -- 心跳信号分类预测. ...

  2. Task01:赛题理解

    街景字符编码识别-task1 街景字符编码识别-赛题理解关于参赛赛题数据评测指标解题思路街景字符编码识别-赛题理解关于参赛通过本次参赛(开始前不知道是比赛,主要是想组队学习)了解CV相关问题的解决思路 ...

  3. 【天池赛事】零基础入门语义分割-地表建筑物识别 Task1:赛题理解与 baseline

    [天池赛事]零基础入门语义分割-地表建筑物识别 Task1:赛题理解与 baseline(3 天) – 学习主题:理解赛题内容解题流程 – 学习内容:赛题理解.数据读取.比赛 baseline 构建 ...

  4. 地表建筑物识别——Task01赛题理解

    前言:这次参加Datawhale与天池联合发起的零基础入门语义分割之地表建筑物识别挑战赛.自己在大四上(2018下半年)也简单接触过语义分割,当时是基于FCN做CT图像乳腺肿瘤的分割.现在参加这个入门 ...

  5. 天池-街景字符编码识别1-赛题理解

    赛题地址 零基础入门CV赛事- 街景字符编码识别 前期环境 运行环境及安装 运行环境 python3.7 pytorch1.3.1 有GPU 首先在Anaconda中创建一个专门用于本次练习赛的虚拟环 ...

  6. 【比赛向】东京证卷交易所预测-赛题理解(Kaggle_2022_Structured Data)

    [比赛向]东京证卷交易所预测-赛题理解(Kaggle_2022_Structured Data) 比赛地址:https://www.kaggle.com/competitions/jpx-tokyo- ...

  7. 天池二手车拍卖赛题理解之特征工程

    天池二手车交易价格预测赛题理解之特征分析常见操作 原文链接:Datawhale 零基础入门数据挖掘-Task3 特征工程 本文为个人阅读笔记,仅记录阅读过程中遇到的新知识. 数据归一化实现: (截图中 ...

  8. 天池NLP学习赛(1)赛题理解

    天池NLP学习赛(1)赛题理解 题目 题目类型:新闻文本分类(字符识别问题)链接 数据: 赛题数据为新闻文本,并按照字符级别进行匿名处理,数字编码形式呈现.整合划分出14个候选分类类别:财经.彩票.房 ...

  9. CCF BDCI“大数据平台安全事件检测与分类识别”赛题,奇点云夺冠

    日前,数据安全领域的人工智能算法顶级赛事"CCF大数据与计算智能大赛·数字安全公开赛"圆满落幕. 奇点云数据安全团队DataBlack在"大数据平台安全事件检测与分类识别 ...

最新文章

  1. [转]Windows与VC命名规则
  2. 【高并发】又一个朋友面试栽在了Thread类的stop()方法和interrupt()方法上!
  3. python list索引_Python按照索引访问list
  4. 计算机主机电池馈电,电脑主机电池没电引起故障怎么处理
  5. java反射机制和junit的使用
  6. Informatica在linux下安装搭建
  7. 解决Windows 8系统假死的方法
  8. codeforces gym-101673 Twenty Four, Again 24点,枚举表达式树过题
  9. [剑指offer][JAVA]面试题第[32-3]题[从上到下打印二叉树 ][BFS]
  10. CUDA 网格级并发-流(1)
  11. 第 20 章 权限管理的基本概念
  12. flask高级编程-循环引用
  13. 关于cmd输入python查看版本号与安装版本不一致的奇怪现象
  14. 求数列的最大子段和java_十大经典排序算法(Java版本)
  15. 拿工资,要做差不多的事
  16. 通达信标记符号_通达信在股票名称后自动标记
  17. execute()方法
  18. word替换妙用:批量去除多余空格、空行、换行2020-11-30
  19. 第4章 网络信息资源检索
  20. Verilog——半加器详解

热门文章

  1. android卡点视频教程,剪映怎么制作卡点视频?剪映app卡点教程
  2. 全军出击机器人进房间_《刺激战场》和《全军出击》快递机器人这么多,你怎么看?...
  3. Unity编程笔记----多语言切换
  4. ysscloud怎么用_红米游戏加速怎么添加到桌面
  5. 两棵二叉搜索树中的所有元素(2022-5-1)每日一练
  6. C语言.表白神器.爱你之心之闪耀
  7. 微信小程序上传图片到html,在微信小程序里上传图片
  8. rake 三兄弟——重置数据库
  9. php微信拍照图库js接口,微信JSSDK 实现打开摄像头拍照再将相片保存到服务器
  10. 一种简单实用的全屏方法