【大数据审计】无须编程,批量提取图片并相似度比对,进行费用真实性审查
前几天,笔者从一个网站上下载了几千行图片的超链接EXCEL,上网寻找各种方法试着批量提取图片,总结网上的方法如下:
1、比较麻烦的方法(技术含量高)
用python写批量提取照片的程序语言,python读取excel中的图片超链接,批量下载到本地。python+excel_m0_46442609的博客-CSDN博客_批量下载excel超链接图片。这个方法对于审计人员来说,需要安装python,且要调试代码。这种方法不太推荐。
2、利用Excel自身宏进行提取
笔者看了一下,这种编写宏进行提取也是需要对程序进行调试,短期内不太科学。对于审计人员来说,用最少时间,达到最理想的效果才是最佳的途径,
3、利用数据抓取工具进行提取
笔者突然想到之前经常利用八爪鱼进行数据抓取。
链接:https://pan.baidu.com/s/1YmHqtb3zmS7hCFHsmjuZ8A
提取码请加我微信:xiaoguo20111101。
利用这个工具能快速批量提取照片,并且能够按照设定好的文件夹进行分裂整理。
4、使用图像比对软件进行批量比对。
按照传统的方式,图形比对需要逐个进行比对,比如1000张照片,需要比对1+2+3+...+999次,速度较慢。利用软件VSDuplicateImageFinderPro可以快速比对出图形相似程度,并且可以设置相似度比例。
不过这款软件是收费版,想要免费版的,可以加我微信。
具体审计使用场景:
在大数据审计中,利用图像批量提取技术以及批量进行图象比对,可以在费用真实性审查中进行使用,比如对于广告投放发生较大的项目,进行图象比对,发现图片存在重复利用。常见的舞弊场景有:
1、两张一模一样的照片。
2、一张照片是另外原图的局部。
3、用手机拍摄另外一部手机照片。
通过批量提取以及图象比对,可以在大数据审计中对费用的真实性进行审查。
【大数据审计】无须编程,批量提取图片并相似度比对,进行费用真实性审查相关推荐
- 《大数据审计》上机实验记录
学习目标: 课程要求是本学期,掌握Python基本语法并且读取文件数据,进行图像绘制. 提示:<Big data audit>2020年秋季开课 实验目录 学习目标: 第一次上机 第二次上 ...
- 基于大数据审计的信息安全日志分析法
大数据信息安全日志审计分析方法 1.海量数据采集.大数据采集过程的主要特点和挑战是并发数高,因此采集数据量较大时,分析平台的接收性能也将面临较大挑战.大数据审计平台可采用大数据收集技术对各种类型的数据 ...
- 观大数据有感_观大数据审计有感
观大数据审计有感 拥抱大数据审计 从我做起 在审计系统集中整训的第四天, 我们聆听学习了一部分先进单位 关于大数据审计应用的经验交流, 审计是专业性很强的工作, 并且紧 跟时代不断更新,闭门造车不可取 ...
- 大数据审计的发展_从历史的角度看大数据审计发展
龙源期刊网 http://www.qikan.com.cn 从历史的角度看大数据审计发展 作者:欧阳双 来源:<中小企业管理与科技 · 上旬刊> 2019 年第 08 期 [摘 要]党的十 ...
- 农林资金 大数据审计案例_大数据审计:现状与发展
大数据审计:现状与发展 [摘要]传统手工环境下,审计人员常用的审计方法包括检查法.观察法.重新计算法.外部调查法.分析法.鉴定法等.随着信息技术的发展,被审计单位的运行越来越依赖于信息化环境.信息化环 ...
- 怎么批量提取图片的文件名?
怎么批量提取图片的文件名?文件夹里有很多的图片,这些图片都用不同人名命名的,现在要将这些图片名称提取到excel表格里,假设现在有这样一个工作认任务交给你,你知道如何处理吗?如果图片的数量非常多,肯定 ...
- 如何批量提取图片名称?
如何批量提取图片名称,再保存在excel表格里?如果有500张图片,这些图片是用姓名来命名的,现在需要将这些图片的名称全部提取出来,你知道如何操作吗?有的朋友会说,这太简单了,没有一点技术含量,只要一 ...
- 【03.03】大数据教程--网络编程
当涉及大数据和网络编程时,一种常见的情况是从网络上获取大量的数据,并对其进行处理和分析.以下是一个使用Python编程语言进行大数据网络编程的示例. 步骤 1: 导入必要的库 首先,我们需要导入Pyt ...
- 大数据审计的发展_科技赋能下大数据审计的实施路径与发展趋势
大数据审计的现状 大数据应用范围不断扩大,但审计理念仍需加强 随着大数据技术优势的凸显,无论是国家机关审计中还是企业内部审计中,越来越倾向于应用大数据技术开展审计.大数据审计的推进 ...
最新文章
- 网警信息安全!_只愿与一人十指紧扣_新浪博客
- 基于php编写的新闻类爬虫,插入WordPress数据库
- 统一修改文件下所有图片大小 Python3
- OpenSql的优化原则
- HDU - 5769 Substring(后缀数组)
- gethostbyname() 函数说明
- Python练习:期末测评
- linux 使用 /proc 文件系统
- 上海找python工作容易吗_Python 在上海什么程度才能找到工作?
- 开源:秋式广告杀手源码
- nginx配置SSL实现服务器/客户端双向认证
- JS开发工具WebStorm使用快捷键
- tpac100控制器设置教程_TP-link AC100控制器配置基础教程
- 练习华为大型公司网络构建拓扑图
- P3324 [SDOI2015]星际战争(洛谷刷题记录)
- native react 折线图_【详解】纯 React Native 代码自定义折线图组件(译)
- 充分利用公网 -- 将联通光猫设置为桥接
- 笃静守一,深耕匠设:2018“渲云杯”全国空间表现大赛颁奖盛典
- win10解决安装时的2503 2502问题
- HTMLParser 使用详解
热门文章
- 封建日本挑战赛:电影/视觉特效角色获奖者访谈
- prproj是什么格式?prproj怎么导入pr?prproj文件怎么打开?prproj预设导入教程
- 作为一名半路出家的程序员,要学的还很多
- 光伏电站清扫机器人_光伏清扫机器人(GF01B)
- App案例实践:一款好用的UI自动化测试工具——Katalon
- 痞子衡嵌入式:导致串行NOR Flash在i.MXRT下无法正常下载/启动的常见因素之QE bit...
- Harry Potter and the Chamber of Secrets
- SecureCRT 密码解密
- 五、docker--进程-文件-网络
- postman发送post请求一直不成功