记录一下研究生第一次参加数模的心路和思路历程

比赛时间:

5月21日8:00-5月25日9:00

赛前准备:

本科期间只参加过校级比赛,数模基础很差。疫情结束返校是5月17日,所以这次比赛属于边赛边准备,做好了充当分母的准备。

  1. 找队友,直接在实验室找了两个同门,大家数模基础都是半斤八两。
  2. 报名,然后官网会提供往年的题目和去年的优秀论文,熟悉出题规律和论文书写套路和格式。
  3. 准备,好在大家都有Matlab和python的基础,所以主要准备一些数模常用的算法。推荐《MATLAB在数学建模中的应用》(卓金武)这本书,我们就是分工分别看了一下组合优化算法(粒子群、遗传算法)、评价算法(熵权法、层次分析法)等。

选题:

mathorcup是研究生可以从A、B中选择一道,今年两道题都是数据分析题,这种题相比于组合优化,对参赛者的基础要求也低一些,这也是我们走运的地方吧。一般是花费一个上午时间确定选题,但我们可能看完题就选完了,首先A题思路比较清晰,其次B题没有提供数据集还需要自己找,而且感觉题目要求也更偏向经管类,最后几个同学的初步意愿也是A题。

问题描述:

A题涉及了一个新概念:无车承运人平台,该平台需要根据不同的货运任务给实际货车承运人提出报价,目标就是花费更少的成本让所有任务都完成。过程中可以对报价进行调价以确保任务被承接。同时题目附带了一个历史货运成交数据集,数据集行为1万6千多个任务,列为其对应的63个任务信息,其中包括很关键的总里程、交易时长、需求紧急程度等信息,也包括不太重要的交易创建时间等信息。以下为题目的四问:

  1. 通过定量分析的方法,研究影响无车承运人平台进行货运线路定价的主要因素有哪些。
  2. 根据附件1数据,建立数学模型,对历史交易数据中的定价进行评价。
  3. 建立关于线路定价的数学模型,给出附件2的线路任务的三次报价总成本定价,给出调价策略并评价给出定价。
  4. 根据研究结果,给无车承运平台提出合理可性的建议。

思路:

这个题目涉及到了两种价格,即 线路的成本价给出的报价。影响两种价格的因素是不完全一样的,比如线路成本价就不会和需求紧急程度、调价类型等因素相关,通过剥离出与之相关的量并找到数学关系,我们就可以根据几个变量预测线路成本价;

那么接下来就只需要考虑三次报价分别是多少了?

我们的出价策略是:第一次逼近历史成交价格下限,第二次采用预测成交价即合理价,第三次采用历史成交价格上限以保证交易不会黄掉。

但这显然是不合理的,举个例子,比如一次短途货运的第三次报价却是历史最高价(长途+非常紧急需求)以保证不流单。

所以我们不再考虑预测报价,转而预测调价比例。这样的话,如果历史交易中只要把价格定为成本价的3倍,任务就一定会成交,那么针对短途货运就可以将第三次报价设为其3倍(后续还要删除过大的离群值来找到这个倍数)。

所以我们通过历史交易来得到预测调价比例的模型,针对给定新的任务信息算出调价比例,将其与成本价相乘即为预测成交价即为第二次报价,再通过记录下历史中的最小和最大调价比例,就能得到第一次和第三次报价。

具体方法:

第一问:

首先对附件1数据集进行预处理(空数据、汉字信息、非连续量、归一化),由于不熟悉数据处理的题,这一步在我们实际比赛中花费了大量的时间,后续还随着对题目了解的深入反复调整数据集。得出新数据集后,利用python进行相关性的热力图分析(用这个方法主要是因为结果图好看)

然后利用SPSS中的因子分析法对筛选后的16个指标进行降维,最终会得到一个成分矩阵,在每一个成分中找到与其显著正相关的指标,即为最后分析出的:影响线路成本价的重要影响因素。

第二问:

需要建立评价模型,评价指标为快速促进成交和较低的承运成本,从附件数据中可以直接转换成交易完成时间调价比例。这一问一开始尝试用层次分析法,但是发现评价指标只有两项,构建权重矩阵后会抵消;尝试熵权法又只能单纯的给所有任务打分,并不能得到区分任务的定价为优、良、差;所以最后查资料选择了主观评价法的秩和比方法。

第三问:

这一问是A题的核心了,思路在前面已经写了。具体的,我们在SPSS中利用多元线性回归并结合第一问中的重要因素,求出了线路成本价的预测模型。然后就是预测调价比例了。我们通过相关性分析发现调价比例与调价类型直接相关,调价类型本身只有调高、调低和不调整三种情况,当不调整价格时,定价直接为线路成本价取整,故忽略此情况后,调价类型可以变为0-1分类问题。于是我们利用数据集对BP神经网络进行训练,让其可以预测调价类型并将其分为调低0和调高1。随后再次利用SPSS的多元线性回归,结合调节类型、交易对象、是否续签、地区类型,预测具体的调价比例数值。

  1. 蓝色散点为附件1历史实际调价比例,其中应该包含历史中调价比例的最大值和最小值;
  2. 橙黄色实线为回归调价比例,即我们通过附件1数据得出的预测模型,其应该接近大部分蓝色散点;
  3. 橙黄色虚线为调整调价比例,A、B为历史数据集离拟合预测曲线偏差较大(正向、反向偏差)的两个点,也就是说当拟合曲线补足这个偏离量时,应包括了调价比例的波动范围。
  4. 红色、黑色实线为调价比例上下限,即为防止调价比例偏差幅度太大而用历史数据集中的调价比例最大最小值。

所以在matlab中计算历史数据集与预测模型的偏离值,去除部分离群点后得到调价比例上下限,即为第三次和第一次调价比例值。

第四问:

语文建模,结合预测模型、评价模型和结果提提意见就可以了。

总结:

  1. 本次比赛也只在最后一晚通宵了,早上六点提交了论文和支撑材料。
  2. 由于三个人都是第一次参加数模国赛,也没有做过数据处理类的题目,第一天花费了很多的时间在寻找思路,中途想放弃也及时刹住了车,多亏了师兄等人的指导。
  3. 对数据预处理的步骤还没理清楚就开工了,导致后期数据集不够完善又要增补删改。
  4. 文件、数据、代码管理混乱,最后一天的晚上手忙脚乱。
  5. 结果还不错,拿了一个二等奖。我一定好好学数模,备战华为杯~

2020年mathorcup数模A题总结回顾相关推荐

  1. 2023年MathorCup数模A题赛题详细思路

    MathorCup俗称妈杯,是除了美赛国赛外参赛人数首屈一指的比赛,而我们的妈杯今天也如期开赛.今年的妈杯难度,至少在我看来应该是2023年截至目前来讲最难的一场比赛.问题的设置.背景的选取等各个方面 ...

  2. 2023年MathorCup数模D题赛题解题思路

    MathorCup俗称妈杯,是除了美赛国赛外参赛人数首屈一指的比赛,而我们的妈杯今天也如期开赛.今年的妈杯难度,至少在我看来应该是2023年截至目前来讲最难的一场比赛.问题的设置.背景的选取等各个方面 ...

  3. 2023年MathorCup数模A题赛题

    A 题 量子计算机在信用评分卡组合优化中的应用 在银行信用卡或相关的贷款等业务中,对客户授信之前,需要先通过 各种审核规则对客户的信用等级进行评定,通过评定后的客户才能获得信 用或贷款资格.规则审核过 ...

  4. 2023年MathorCup数模B题赛题

    B 题 城市轨道交通列车时刻表优化问题 列车时刻表优化问题是轨道交通领域行车组织方式的经典问题之一. 列车时刻表规定了列车在每个车站的到达和出发(或通过)时刻,其在实 际运用过程中,通常用列车运行图来 ...

  5. 2020 华为杯 数模 B题 数据挖掘

    B题是一道数据挖掘题目 主要难点是 :题目样本较小,但是样本的维度又很大,需要分析的目标与数据之间的关系不明显 解决这个题目应该注重以下几方面 1.审题,对题目的要求一定要看清楚,特别是对提供的数据一 ...

  6. 2023年MathorCup数模C题赛题

    C 题 电商物流网络包裹应急调运与结构优化问题 问题C,题目的设置就是本科生专科生选题,因此在题目难度上应该会和AB,有明显的区别.整个问题的设置还是很符合妈杯的风格设置,下面我们简要的看一下各个题目 ...

  7. 2021年研究生数模B题论文记录

    2021年研究生数模B题论文记录 1.常见数据处理方法: 2.相关性系数选择 3.聚类算法 4.一种数据降维方式 5.预测模型 文章来源 2021年全国大学生研究生数学建模竞赛优秀论文集合,B题,文章 ...

  8. 2022国赛数模A题思路以及解析(附源码 可供学习训练使用)

    需要全部源码或者论文请点赞关注收藏后评论区留言 前言 发布已获得创作队伍的同意,论文最终斩获省一等奖,写的十分优秀,可供后面的数模比赛训练参考 摘要 基于摇荡模型的波浪能装置最大输出功率设计问题研究 ...

  9. 2020第十七届华为杯数模C题——P300脑电信号数据预处理算法

    脑电信号数据预处理   这两天的数学建模选的C题,目标是要处理脑电P300信号的数据并进行相关预测任务.该题重点是数据预处理,因此根据最后实验的结果,分享相关的预处理方法以及源代码.长话短说,给出任务 ...

  10. 2020年MathorCup数学建模D题新零售目标产品的精准需求预测解题全过程文档加程序

    2020年第十届MathorCup高校数学建模 D题 新零售目标产品的精准需求预测 原题再现   随着我国消费市场的不断发展,市场上的消费模式已经逐步由"以物为主"转变为" ...

最新文章

  1. 科普:不要对移动机器人有误解
  2. console 非常实用的方法
  3. 如何提高Google Adsense单价:点击率篇
  4. php stortime,文件存储 | 综合话题 | Laravel 5.3 中文文档
  5. 个人控件/对象命名规范(慢慢更新)
  6. C# 中执行 msi 安装
  7. 解读畅捷通微服务治理能力提升之路
  8. java json web token_一分钟简单了解JSON Web Token
  9. WiFi PHY技术之自动增益控制(AGC)
  10. 精益创业实战 - 第5章 开始实验
  11. css实现图片虚化_css怎么虚化背景图片?css虚化背景图片的方法介绍
  12. android地图方位角,根据两点经纬度,计算距离、方位角
  13. c#录音和放音,超简单!不用DirectX
  14. 恶意访问、黑产猖獗,如何做好业务安全“守门人”?丨创新场景50
  15. 程序员的自我修养--链接、装载与库笔记:第一章温故而知新
  16. hive 留存率 计算
  17. CodeForces 711C Coloring Trees (三维DP)
  18. LF4J: No SLF4J providers were found. SLF4J: Defaulting to no-operation (NOP) logger implemen
  19. 华为开发者联盟鸿蒙系统,公告 | 华为开发者联盟
  20. 商业模式的定义、商业模式的好坏

热门文章

  1. GeoServer发布shp数据
  2. 东南大学c++非电类期末试卷 程序设计与算法语言,挑战程序设计竞赛2:算法和数据结构 中文完整pdf版[55MB] 附源码...
  3. 《挑战程序设计竞赛》阅读笔记
  4. AD18的PCB开槽方法
  5. c语言中find的作用,c语言find函数的用法详解
  6. CSDN免费获得积分和直接获取下载码的方法,亲测有效
  7. 浅谈SQL语言的特点
  8. php源码 备课系统,电子教案管理系统2012版 V3.2
  9. 惠普p1106打印机安装步骤_hplaserjetp1106打印机驱动安装说明
  10. 用gambit学博弈论--完全信息动态博弈(一)