PDF处理还收费?不可能
DevWeekly收集整理每周优质开发者内容,包括开源项目、工具资源、技术文章等方面,每周五首发于DevWeekly,欢迎大家Star并收藏!
原文链接:DevWeekly | 第2期:重构代码的10个最佳实践
DevWeekly每周五首发于Github,欢迎大家Star并收藏!
DevWeekly收集整理每周优质开发者内容,包括开源项目、资源工具、技术文章等方面。
欢迎大家投稿,提交issue,推荐或者自荐开源项目/资源/工具/文章~
订阅方式:
- Star并收藏项目DevWeekly
- 关注 知乎:Jackpop
开源项目
1. dot
dot(Deepfake Offensive Toolkit)是一款将deepfakes实时的、可控制的应用于在线视频的工具。
简单的翻译过来就是深度伪造,换句话说,它是通过人工智能技术,能够将目标对象的面部特征嫁接到被模仿的对象上,给目标对象进行换脸。
2. codecat
CodeCat是一款可以帮助你使用静态代码分析功能找到/追踪用户输入和安全漏洞的开源工具,这对于代码开发中的安全控制非常有价值。
目前它适用于C、C++、GO、Python、javascript、Swift、PHP、Ruby、ASP、Kotlin、Dart和Java。
3. OCRmyPDF
PDF有很多不同类型,直接通过word等格式转换的可以直接复制粘贴,操作比较简单。但是,扫描版的PDF则比较麻烦。
OCRmyPDF为扫描的PDF文件添加OCR文本层,使其能够被搜索或复制粘贴。
- 基于普通的PDF生成一个可搜索的PDF/A文件
- 将OCR文本准确地放在图像下面,以方便复制/粘贴
- 保持原始嵌入图像的准确分辨率
- 优化PDF图像,生成的文件通常比输入文件小
- 使用Tesseract OCR引擎,支持识别100多种语言
- 能处理数千页的文件
4. data-diff
data-diff是一个命令行工具和Python库,能够用于对比两个不同数据库的差异。
目前,它已经在多种不同类型的数据库上进行过验证,而且对于对比结果可以通过CLI/API的形式来创建监控和告警,能够兼容不同的字段类型。速度也非常快,10s内能够验证25M+行数据。
data-diff将表分割成更小的片段,然后在两个数据库中对每个片段进行校验。当一个段的校验和不相等时,它将进一步把这个段分成更小的段,对这些段进行校验,直到它得到不同的行。
5. cfg4j
cfg4j,也就是configuration for Java,一种开源的配置库,可以用于Java开发的分布式应用。
- 自动重新加载配置
- 强大的配置机制(接口绑定,多源支持与回退策略,合并等等)。
- 分布式环境友好(缓存,支持多种环境[测试,预开发,生产],…)
- 读取配置:Consul、Git repos(YAML和/或属性)、文件、Classpath, …
- 与DI容器无缝集成:Spring、Guice等
- 与Metrics库的集成来展示性能指标
- 经过大量的测试(99%的代码覆盖率)
- 完善的文档
6. Decompiler
顾名思义,通过这款工具,我们可以对已经编译的Java jar包,可以反编译复杂的Java applets和二进制文件,产生准确的源代码。
7. scrutiny
如果你运行的服务器有几个硬盘,你可能已经熟悉S.M.A.R.T和smartd守护程序。
smartd是一个监控许多ATA、IDE和SCSI-3硬盘中内置的自我监测、分析和报告技术(SMART)系统的守护进程。
SMART的目的是监测硬盘的可靠性和预测硬盘故障,并进行不同类型的硬盘自我测试。
8. sake
你在 sake.yaml 配置文件中定义服务器和任务,然后在服务器上就可以运行任务。
9. codewarrior
10. wayfire
Wayfire是一个3D Wayland合成器,灵感来自于Compiz并基于wlroots。
它旨在创建一个可定制的、可扩展的和轻量级的环境,而不用以牺牲外观作为代价。
资源工具
1. Pomsky
Pomsky是一种可以编译成正则表达式的语言,它目前处于alpha阶段。
# String
'hello world' # hello world# Greedy repetition
'hello'{1,5} # (?:hello){1,5}
'hello'* # (?:hello)*
'hello'+ # (?:hello)+# Lazy repetition
'hello'{1,5} lazy # (?:hello){1,5}?
'hello'* lazy # (?:hello)*?
'hello'+ lazy # (?:hello)+?# Alternation
'hello' | 'world' # hello|world
2. GameShell
学习Unix shell是有一定成本的,GameShell被设计成一种工具,帮助学生接触到shell,通过游戏的方式在鼓励学习的同时也能获得乐趣。
3. Commands.dev
每个工程师都有过忘记终端命令的时候,因为它很少被使用,或者有难以理解的复杂参数。
当这种情况发生时,不得不在他们的终端命令历史中进行搜索,或者打开浏览器进行搜索。
Commands.dev是一个开源的、可搜索的、从整个互联网上收集的流行终端命令的集合。你可以按类别(git、android、docker)查找命令,每个命令都会告诉你需要插入哪些参数。
4. PyScript
它是一个框架,允许用户使用HTML的界面和Pyodide、WASM等,在浏览器中创建丰富的Python应用程序。
PyScript框架为各种经验水平的用户提供了一种具有无数应用的、易于学习的编程语言。
5. Hedy
学习编程可能很困难,不是说编程本身很难,而是有很多规则你需要记住,就像你开始学习英语时一样。
Hedy则是一款渐进式的编程语言。这意味着,你不必一次就学会所有的规则,最初的几个级别没有那么多规则,所以你可以轻松地适应编程。
在每个级别中,都会增加新的规则,增加命令的数量,循序渐进的进行学习。
技术文章
1. 用Java和Python进行数据统计和分析
提起数据统计与分析,很多同学第一印象想到的就是Python或者R。
其实,Java也是一款在数据领域应用非常广泛的编程语言,例如,Flink、hive等都对Java有很好的支持。
在这篇文章中,重点研究如何使用Java和Python对大量的表格数据进行简单的数据分析并计算一些统计数据。
在这里,可以看到如何在每个平台上进行数据分析的不同技术,比较它们如何扩展,以及应用并行计算来提高其性能的可能性。
2. 重构代码的10个最佳实践
编写代码并不仅仅为了它能够正常执行并输出结果,还要考虑它的设计模式、扩展线、可读性等。
无论是为了性能、可读性还是可维护性,重构代码都是一项基本技能。
PDF处理还收费?不可能相关推荐
- 传智播客还收费 兄弟会都是免费的
[传智播客还收费 兄弟会都是免费的 兄弟连兄弟会it开发培训 www.itxdh.net 企鹅群:499956522 高端人才培养就到[兄弟连兄弟会it开发培训]纯免费的高端IT人才培养] 传智播客, ...
- aws终止实例后还收费吗_因 AWS 数据中心断电,1TB 数据丢失了
美国劳动节周末,亚马逊网络服务中心的一个数据中心发生断电,导致部分客户数据丢失. 我们被告知,当电源耗尽,备份生成器随后出现故障时,一些虚拟服务器实例就会消失,而一些云承载的卷就会被销毁,必须从备份中 ...
- 临近下班又开会,熬夜加班写纪要,语音转写还收费……
先声明,这是一篇吐槽为主.介绍为辅的小短文,是一位打工人心酸历程的吐槽记录,一位底层员工拯救头秃的回忆录.大家自行选择阅读啊! 小编最近离职了,所以就可以肆无忌惮的写这么一篇吐槽前领导的文章.有类似经 ...
- 怎么把多个JPG合并成一个PDF?还不快来学
我们通常在处理工作文件时会有很多JPG图片需要传输,不过JPG图片数量一般都非常多,我们需要一张一张的进行传输,不仅会浪费很多时间,还很不方便查看,所以我们就可以及将JPG图片合并到一个PDF文件中, ...
- 100份PDF合并还不到3分钟,这2个方法非常简单,请低调使用
PDF文件作为我们工作中最为常见的"文件格式"之一.似乎哪里都有它的身影,有时我们还需要对PDF文件进行编辑和处理.那么,在众多PDF编辑和处理操作上,PDF合并可以算得上使用频率 ...
- 网页导出pdf不完整_今天才知道!Word、Excel、PDF格式还能随意转换,20秒即可实现...
前几天有粉丝私信转换君说为什么格式转换这么难?每次都要将内容复制过去再调整格式,一个小时才转换十几份文件,真是太难了! 看完这个私信,转换君发现之前给大家补的课都白补了,不过作为宠粉达人的我,还是再给 ...
- 黑马程序员还收费 兄弟会都是免费的
纳尼?免费?无利不起早,更何况是商业化的培训机构,许多学员对此不免持有怀疑态度.是的,免费的馅饼不会无缘无故垂青于你的,这是一个双方共赢的模式,好了,现在我就兄弟会免费培训详细阐述下,以此来打消疑虑尚 ...
- 亚马逊平台还收费吗?收费多少?
亚马逊是收费的,只要你的账户开通了就要给亚马逊交费.这个就是账户管理费.其实不用觉得不公平,这种费用几乎所有的平台都会收.就向百度营销,也会收取平台管理费. 除此之外,亚马逊全球收款也有低费用政策.亚 ...
- CAJ转PDF,仅需5秒还免费,PDF文字还能复制
之前一直想着CAJ转PDF,结果2M以上就要钱?我TM服了,我的CAJ文档刚好2.1M.找了大半天,百度搜索也就那几个. 于是乎,自己做一个吧. 网站在线地址.由于新建立的网站,搜索太难了,干脆娶个名 ...
最新文章
- python-opencv 形态学
- linux 防火墙开机启动项,Ubuntu 9.10下实现Firestarter网络防火墙自启动
- 从0-1教你利用服务器做属于自己的个人博客
- insert into 多条数据_「数据库」一千行MySQL命令
- Android 获取地理位置获取经纬度
- hadoop--Yarn资源调度器的基础架构、工作机制 与 作业提交全过程
- 2021年数据科学家面试:4个基本SQL窗口函数介绍以及示例
- java instant获取微秒转成日期格式_Java8新特性时间日期库DateTime API及示例
- 搜狗2020年测试工程师笔试题
- linux单引号、双引号、特殊字符、换行符等用法
- 推荐背单词最有效的方法:使用艾宾浩斯记忆曲线背单词
- 2018 计蒜之道 初赛 第一场
- JS性能优化 之 FOR循环
- phalapi做登录检测_1.4 PhalApi 2.x 接口响应与在线调试
- 编程基本功:典型的柳氏风格命名一例
- 转:zTree树控件入门之checkbox:如何动态设置节点的checkbox选择框启用与禁用状态(chkDisabled)...
- 2022年智慧城市大脑及智慧城市驾驶舱大数据资源平台建设总体架构方案
- 云打印SDK来袭,支持飞鹅云,芯烨云,易联云,优声云等云打印机
- 原创 | 不瞒你说,我也参加过培训
- invalid suffix on literal; C++11 requires a space between literal and string macro [-Wliteral-suffix
热门文章
- matlab关于disp的使用方法
- 改进YOLOv5、YOLOv8系列:14.添加S2-MLPv2注意力机制
- Qt开发——QWebEngineView简易网络浏览器(二)
- ubuntu java 关闭进程_如何在Ubuntu中关闭Tomcat?
- 「Python 网络自动化」目录汇总
- make linux命令详解,Linux中make命令起什么作用呢?
- C语言程序设计第2章节练习题
- kattis Block Game + Chess Tournament + Completing the Square + Millionaire Madness
- 已移除测试人员怎么恢复_Win7系统运行Word 2007提示已停止工作怎么恢复
- 自动驾驶/驾驶辅助系统:车辆动力学与ADAS/AD性能评估软件-MXeval助力自动驾驶性能评估—Shape Better Cars