前几天,笔者从一个网站上下载了几千行图片的超链接EXCEL,上网寻找各种方法试着批量提取图片,总结网上的方法如下:

1、比较麻烦的方法(技术含量高)

用python写批量提取照片的程序语言,python读取excel中的图片超链接,批量下载到本地。python+excel_m0_46442609的博客-CSDN博客_批量下载excel超链接图片。这个方法对于审计人员来说,需要安装python,且要调试代码。这种方法不太推荐。

2、利用Excel自身宏进行提取

笔者看了一下,这种编写宏进行提取也是需要对程序进行调试,短期内不太科学。对于审计人员来说,用最少时间,达到最理想的效果才是最佳的途径,

3、利用数据抓取工具进行提取

笔者突然想到之前经常利用八爪鱼进行数据抓取。

链接:https://pan.baidu.com/s/1YmHqtb3zmS7hCFHsmjuZ8A 
提取码请加我微信:xiaoguo20111101。
利用这个工具能快速批量提取照片,并且能够按照设定好的文件夹进行分裂整理。

4、使用图像比对软件进行批量比对。

按照传统的方式,图形比对需要逐个进行比对,比如1000张照片,需要比对1+2+3+...+999次,速度较慢。利用软件VSDuplicateImageFinderPro可以快速比对出图形相似程度,并且可以设置相似度比例。

不过这款软件是收费版,想要免费版的,可以加我微信。

具体审计使用场景:

在大数据审计中,利用图像批量提取技术以及批量进行图象比对,可以在费用真实性审查中进行使用,比如对于广告投放发生较大的项目,进行图象比对,发现图片存在重复利用。常见的舞弊场景有:

1、两张一模一样的照片。

2、一张照片是另外原图的局部。

3、用手机拍摄另外一部手机照片。

通过批量提取以及图象比对,可以在大数据审计中对费用的真实性进行审查。

【大数据审计】无须编程,批量提取图片并相似度比对,进行费用真实性审查相关推荐

  1. 《大数据审计》上机实验记录

    学习目标: 课程要求是本学期,掌握Python基本语法并且读取文件数据,进行图像绘制. 提示:<Big data audit>2020年秋季开课 实验目录 学习目标: 第一次上机 第二次上 ...

  2. 基于大数据审计的信息安全日志分析法

    大数据信息安全日志审计分析方法 1.海量数据采集.大数据采集过程的主要特点和挑战是并发数高,因此采集数据量较大时,分析平台的接收性能也将面临较大挑战.大数据审计平台可采用大数据收集技术对各种类型的数据 ...

  3. 观大数据有感_观大数据审计有感

    观大数据审计有感 拥抱大数据审计 从我做起 在审计系统集中整训的第四天, 我们聆听学习了一部分先进单位 关于大数据审计应用的经验交流, 审计是专业性很强的工作, 并且紧 跟时代不断更新,闭门造车不可取 ...

  4. 大数据审计的发展_从历史的角度看大数据审计发展

    龙源期刊网 http://www.qikan.com.cn 从历史的角度看大数据审计发展 作者:欧阳双 来源:<中小企业管理与科技 · 上旬刊> 2019 年第 08 期 [摘 要]党的十 ...

  5. 农林资金 大数据审计案例_大数据审计:现状与发展

    大数据审计:现状与发展 [摘要]传统手工环境下,审计人员常用的审计方法包括检查法.观察法.重新计算法.外部调查法.分析法.鉴定法等.随着信息技术的发展,被审计单位的运行越来越依赖于信息化环境.信息化环 ...

  6. 怎么批量提取图片的文件名?

    怎么批量提取图片的文件名?文件夹里有很多的图片,这些图片都用不同人名命名的,现在要将这些图片名称提取到excel表格里,假设现在有这样一个工作认任务交给你,你知道如何处理吗?如果图片的数量非常多,肯定 ...

  7. 如何批量提取图片名称?

    如何批量提取图片名称,再保存在excel表格里?如果有500张图片,这些图片是用姓名来命名的,现在需要将这些图片的名称全部提取出来,你知道如何操作吗?有的朋友会说,这太简单了,没有一点技术含量,只要一 ...

  8. 【03.03】大数据教程--网络编程

    当涉及大数据和网络编程时,一种常见的情况是从网络上获取大量的数据,并对其进行处理和分析.以下是一个使用Python编程语言进行大数据网络编程的示例. 步骤 1: 导入必要的库 首先,我们需要导入Pyt ...

  9. 大数据审计的发展_科技赋能下大数据审计的实施路径与发展趋势

    大数据审计的现状      大数据应用范围不断扩大,但审计理念仍需加强      随着大数据技术优势的凸显,无论是国家机关审计中还是企业内部审计中,越来越倾向于应用大数据技术开展审计.大数据审计的推进 ...

最新文章

  1. 网警信息安全!_只愿与一人十指紧扣_新浪博客
  2. 基于php编写的新闻类爬虫,插入WordPress数据库
  3. 统一修改文件下所有图片大小 Python3
  4. OpenSql的优化原则
  5. HDU - 5769 Substring(后缀数组)
  6. gethostbyname() 函数说明
  7. Python练习:期末测评
  8. linux 使用 /proc 文件系统
  9. 上海找python工作容易吗_Python 在上海什么程度才能找到工作?
  10. 开源:秋式广告杀手源码
  11. nginx配置SSL实现服务器/客户端双向认证
  12. JS开发工具WebStorm使用快捷键
  13. tpac100控制器设置教程_TP-link AC100控制器配置基础教程
  14. 练习华为大型公司网络构建拓扑图
  15. P3324 [SDOI2015]星际战争(洛谷刷题记录)
  16. native react 折线图_【详解】纯 React Native 代码自定义折线图组件(译)
  17. 充分利用公网 -- 将联通光猫设置为桥接
  18. 笃静守一,深耕匠设:2018“渲云杯”全国空间表现大赛颁奖盛典
  19. win10解决安装时的2503 2502问题
  20. HTMLParser 使用详解

热门文章

  1. 封建日本挑战赛:电影/视觉特效角色获奖者访谈
  2. prproj是什么格式?prproj怎么导入pr?prproj文件怎么打开?prproj预设导入教程
  3. 作为一名半路出家的程序员,要学的还很多
  4. 光伏电站清扫机器人_光伏清扫机器人(GF01B)
  5. App案例实践:一款好用的UI自动化测试工具——Katalon
  6. 痞子衡嵌入式:导致串行NOR Flash在i.MXRT下无法正常下载/启动的常见因素之QE bit...
  7. Harry Potter and the Chamber of Secrets
  8. SecureCRT 密码解密
  9. 五、docker--进程-文件-网络
  10. postman发送post请求一直不成功