https://www.toutiao.com/a6700781043856704008/

2019-06-10 14:12:43

整理 | Rachel责编 | Jane出品 | AI科技大本营(id:rgznai100)

【导语】随着机器学习和数据科学的不断发展,相关技术在越来越多的领域得到了应用,机器学习、数据科学和其他学科的结合已经成为了必然趋势。在本文中,我们给大家分享了一个包含机器学习和数据科学技术在工业界开源应用的 Github 项目,具体领域包括会计、银行和保险业务、法律和法规、政府和公共政策等等。该项目仍在持续更新中。

随着机器学习和数据科学技术的不断发展,在工业界出现了越来越多的相关技术应用,学科交叉已经成为必然趋势。

在今天的分享中,营长为大家选取了一个来自GitHub的项目,该项目整理了机器学习和数据科学在工业界的落地应用,应用领域包括会计、银行和保险业务、法律和法规、政府和公共政策等领域。在该项目中,除非特别注明,作者分享的大部分项目都基于 Python 。另外,为了使得项目代码更具参考性,该项目列表没有包含明确声明“不再更新”或者已超出2年未更新的相关项目。

先为大家梳理了一下该项目的相关内容,以便大家快速查看。如果希望进一步了解相关内容,可查看文末的 GitHub 项目地址。

在该项目中,作者尝试对机器学习和数据科学在工业界的具体应用情况进行汇总,预计包含的领域如下表:

目前,作者已经整理了会计、银行和保险业务、法律和法规、政府和公共政策四个领域的相关开源项目情况,并进行了归纳和汇总。对于每个领域,作者对相关资源进行了分类和项目汇总,并给出了每个项目的链接和简短介绍。该项目列表仍在持续更新中。

领域:会计

作者将会计相关的应用划分为7类,包括机器学习、数据分析、文本分析、数据获取与处理、相关研究和文章、网站、课程。下面对各部分进行分别介绍。

  • 机器学习

1. Chartof Account Prediction:使用带标签的数据集预测每笔交易的账户名称。

2. AccountingAnomalies:使用深度学习框架识别会计信息中的异常。

3. FinancialStatement Anomalies:基于 R语言,在会计文件归档前检测会计异常信息。

4. UsefulLife Prediction:使用传感器数据和特征工程预测资产的可使用年限。

5. AI Applied to XBRL:将可扩展商业报告语言(XBRL)用于 AI 和机器学习。

  • 数据分析

1. ForensicAccounting:包含使用数据分析手段进行法务会计的案例研究集合。

2. GeneralLedger:对会计系统中的总账进行数据处理。

3. BulletGraph:以子弹图(bullet graph)形式对销售、委托及其他会计活动进行可视化。

4. AgedDebtors:对长期债务人的案例分析。

5. AutomatedFS XBRL:自动生成 XBRL ,也可使用 python 格式输出。

  • 文本分析

1. FinancialSentiment Analysis:对交易信息进行情感分析、距离分析和交易份额分析。

2. Extensive NLP:针对会计研究的 NLP 技术汇总。

  • 数据,句法分析和 APIs

1. EDGAR:获取电子化数据收集、分析及检索系统(EDGAR)数据的指南。

2. IRS:获取美国国家税务局(IRS)归档数据并进行句法分析的指南。

3. FinancialCorporate:罗格斯大学提供的金融数据集

4. Non-financialCorporate:罗格斯大学提供的非金融公司数据集

5. PDFParsing:从 PDF 文件中抽取有用信息

6. PDFTabel to Excel:从 PDF 文件中输出表格

  • 研究和文章

1. UnderstandingAccounting Analytics:介绍了会计分析的重要性。

2. VLFeat:一个计算机视觉算法的开源库,并且提供了 Matlab 工具。

  • 网站

1. RutgersRaw:罗格斯大学的数字会计研究

  • 课程

1. ComputerAugmented Accounting:罗格斯大学的系列视频课程,主要讲解如何将计算机手段应用到会计中。

2. Accountingin a Digital Era:罗格斯大学的系列视频课程,主要讲解数字时代对会计的影响。

领域:银行和保险业

作者将该领域归纳为7部分内容,包括消费经济、管理、评估、欺诈、保险业及其风险、物质基础、数据。下面进行分别介绍。

  • 消费金融

1. LoanAcceptance:对借贷成功率的分类和时序分析。

2. PredictLoan Repayment:使用自动特征工程预测贷款是否会被归还

3. LoanEligibility Ranking:检验消费者是否具有贷款资质的系统

4. HomeCredit Default:预测家庭信用违约

5. MortgageAnalytics:对按揭贷款的扩展分析

6. CreditApproval:辅助信用卡办理申请批准的系统

7. LoanRisk:通过预测模型降低坏账率,减小贷款损失

8. Amortisationschedule:用于个人使用的自动分期付款计划

  • 管理

1. CreditCard:对信用卡消费者进行顾客终生价值(CLV)评估

2. SurvivalAnalysis:对顾客进行生存分析

3. NextTransaction:使用深度学习模型预测下一次交易的金额和时间

4. CreditCard Churn:预测信用卡顾客流失

5. Bankof England Minutes:对英国银行记录的文本分析

  • 评估

1. ZillowPrediction:预测 Zillow 公司提供的估价情况

2. RealEstate:评估城市地区的地产价格

3. UsedCar:二手车价格预测

  • 欺诈

1. XGBoost:使用模拟退火算法调整 XGBoost 超参数以预测欺诈行为

2. FraudDetection loan in R:对银行借贷的欺诈预测

3. AMLFinance Due Diligence:使用新闻进行反洗钱尽职调查

4. CreditCard Fraud:预测信用卡欺诈行为

  • 保险业及其风险

1. BankFailure:对银行破产进行预测

2. RiskManagement:关于金融业风险参与的课程资源

3. VaRGaN:使用 Keras 和 Tensorflow 评估市场风风险参与情况

4. ActuarialSciences (R):基于 R 语言的精算工具列表

  • 物质基础

1. BankNote Fraud Detection:使用Tensorflow 和随机森林对纸币进行鉴定

2. ATMSurveillance:银行 ATM 监控

  • 数据

1. EmployeeCount SEC Filings

2. SECParsing

3. OpenEdgar

4. RatingIndustries

  • 法律法规

在该部分,作者介绍了3部分内容的相关应用,包括工具、政策和法规、司法应用。

  • 工具

1. LexPredict:一个相关的代码库

2. AIPara-legal: AI 法律助理

3. LegalEntity Detection:对法律文件的命名实体识别

4. LegalCase Summarisation:对司法判例进行文摘的多种算法汇总

5. LegalDocuments Google Scholar:使用 Google scholar 自动抽取判例

6. ChatBot:法律领域的聊天机器人和邮件通知应用

  • 政策和法规

1. GDPRscores:依据通用数据保护条例(GDPR)对法律文件的评分进行预测

2. DrivingFactors FINRA:对美国金融监管局(FINRA)发布限制令的影响因素分析

3. SecuritiesBias Correction:安全法规对价格影响的估计

4. PublicFirm to Legal Decision:分析上市公司对法律政策的反应

  • 司法方面的应用

1. SuremeCourt Prediction:预测最高法院的观念立场

2. SupremeCourt Topic Modeling:对最高法院的决定进行主题挖掘

3. JudgeOpinion:使用文本分析方法和机器学习分析法官针对某议题的观点

4. ML LawMatching:使用机器学习匹配案例相关法律条例

5. BertMulti-label Classification:使用 AI 进行细粒度情感分析

6. SomeComputational AI Course:MIT的相关视频课程

领域:政府和公共政策

在该部分,作者介绍了5部分内容,包括社会政策、选举分析、灾难管理、城市规划、设施。

  • 社会政策

1. Triage:对政策和公共利益问题的风险建模和预测工具

2. WorldBank Poverty I:对用于贫困预测的机器学习分类算法的比较优势分析

3. WorldBank Poverty II:基于世界银行数据的贫困分析

4. OverseasCompany Land Ownership:分析英国的外企情况

5. CFPB:美国消费者权益保护局(CFPB)的投诉分析

6. CannabisLegalisation Effect:关于大麻制品的法规对犯罪活动的影响分析

  • 选举分析

1. ElectionAnalysis:选举分析和预测模型

2. AmericanElection Causal:使用美国国家选举研究所(ANES)的数据构建因果推断模型

3. CampaignFinance and Election Results:对竞选经费和后续选举结果间关系分析

  • 灾难管理

1. ConflictPrediction:冲突预测的相关代码

2. BurglaryPrediciton:构建时空模型以预测入室盗窃

3. PredictiongDisease Outbreak:基于机器学习算法的相关应用

4. Roadaccident prediction:对巴西的联邦公路的车祸分析

5. Text Mining:使用文本挖掘进行灾难管理

6. Twitterand disasters:预测 twitter是否涉及灾难事件

  • 城市规划

1. TrafficPrediction:使用多注意力机制的循环神经网络模型对城市交通

进行时序分析

2. PredictCrashes:使用多数据来源的车祸预测模型

3. PredictHousehold Poverty:使用自动特征工程对哥斯达黎加的家庭贫困情况进行预测

  • 设施

1. AirQuality Prediction:预测北京和伦敦在未来48小时的空气质量

2. WaterAccountng: 对美国的水费预算进行预测

3. ElectrcityFrench Distribution:对法国的电力数据分布进行分析

以上就是今天的分享,希望对大家有所帮助。

Github 项目地址:https://github.com/firmai/industry-machine-learning

机器学习在金融、法律等领域的技术应用 | Github推荐相关推荐

  1. 机器学习在金融领域的应用:风险控制、投资策略与市场预测

    文章目录 机器学习在金融领域的应用:风险控制.投资策略与市场预测 引言 概念和术语介绍 金融风险控制 投资策略 市场预测 关键问题分析 问题解决方案核心原理讲解 数据准备和清洗 模型设计和训练 模型评 ...

  2. 在金融科技的诸多技术领域,目前最引人瞩目的当属区块链

    金融业的数字化转型引发持续关注.数字金融.智能金融.区块链等关键词都得到了热烈讨论.数据,作为一种新型生产要素,早已成为推动国经济质量发展的重要动能.数据智能驱动金融业蝶变,"一切业务数据化 ...

  3. julia应用于自动驾驶汽车、机器人、3D 打印、精准医疗、增强现实、基因组学、能源交易、机器学习、金融风控和太空任务设计等多个领域...

    编程界的新宠 Julia 发布 1.0 正式版本,多种优势集于一身 2018-08-14 14:14 公司 Julia 的累积下载次数超过 200 万,已被应用于自动驾驶汽车.机器人.3D 打印.精准 ...

  4. AutoML:人工智能领域-自动化技术之机器学习自动化技术的简介(预处理→设计算法→训练模型→优化参数)、常用的工具或框架之详细攻略

    AutoML:人工智能领域-自动化技术之机器学习自动化技术的简介(预处理→设计算法→训练模型→优化参数).常用的工具或框架之详细攻略 目录 自动化机器学习技术的简介

  5. 【问链财经-区块链基础知识系列】 第二十二课 贸易金融区块链平台的技术机理与现实意义

    简介:贸易金融区块链平台的技术机理.模式.优势与现实意义都有哪些?对湾区贸易金融区块链平台的未来建设有何展望?本文将进行详述. 小微企业贡献了我国60%以上的GDP.50%以上的税收以及80%的城镇就 ...

  6. 机器学习用于金融市场预测难在哪?

    摘要: 本文主要讲述了机器学习用于金融市场预测难在哪?--金融间序是典型的部分可见马尔科夫决策过程(POMDP) · 数据分布 · 小样本 · 难以计算的数据 · 十分复杂 · 部分可见马尔科夫决策过 ...

  7. 深入了解AI在金融、能源领域的网络安全应用

    众所周知人工智能技术得到了广泛的应用,并且深入各行各业当中,同时人工智能实现了从学术理论到产业应用的飞跃,在金融.医疗.教育.能源等众多领域实现了产业赋能.人工智能技术在网络安全领域的研究和应用也得到 ...

  8. 欧盟通用数据保护条例GDPR.docx数据摘要 导读:GDPR通用数据保护条例中文版由中国政法大学互联网金融法律研究院组织翻译, 新法案由11章共99条组成。 GDPR的通过意味着欧盟对个人信息保

    欧盟通用数据保护条例GDPR.docx数据摘要  导读:GDPR通用数据保护条例中文版由中国政法大学互联网金融法律研究院组织翻译, 新法案由11章共99条组成. GDPR的通过意味着欧盟对个人信息保护 ...

  9. [网络安全]数据安全领域关键技术总结

    [网络安全]数据安全关键技术总结 前言 去标识计算技术 概念 底层逻辑 功能实现 拉普拉斯噪音 脱敏技术 概念 底层逻辑 功能实现 数据替换及数据遮蔽 去隐私技术 概念 底层逻辑 功能实现 去隐私技术 ...

最新文章

  1. boost::hana::capture用法的测试程序
  2. flume使用telnet作为入口出现connection refused
  3. 客制化键盘键位修改_可以用很漂亮形容的一把键盘,差一步就完美
  4. leetcode1296. 划分数组为连续数字的集合(贪心算法)
  5. qt5.3.1+opencv2.4.9编译环境的搭建
  6. 基于WF4的新平台-流程模式-(9)表单路由启动传入
  7. 视觉SLAM笔记(3) 视觉SLAM框架
  8. windows加载linux分区,如何实现在linux系统启动时就加载windows分区(ntfs分区)
  9. nosetest忽略执行指定文件方法
  10. JSP企业人事管理系统
  11. oracle删库语句,oracle删除表语句是什么?_数据库
  12. 梁念坚漫步“云+端”
  13. 【论文阅读】DeepPap: Deep Convolutional Networks for Cervical Cell Classification
  14. ln -sf是永久生效的吗linux,ln -s 软连接介绍
  15. 为什么跑椭圆机比跑步更累
  16. 什么是 10x 程序员?
  17. Sanity Check: SRM, AA test
  18. 用 yo aspnet 生成.net项目
  19. 传雅虎秘密搜索用户电邮为美国安全官员提供信息
  20. 安全漏洞一内核漏洞利用

热门文章

  1. vue 对于el-table中表头使用下拉框
  2. “极思维”舒权文:不起眼的扫地机如何承载家居平台
  3. OpenGL中投影函数glOrtho()、glFrustum()以及gluPerspective()以及函数的用法
  4. Oracle Hints 语句的用法
  5. 天宝MN18 amd4800h mini主机 到手测试
  6. Idea中Jdk和Language level的指定
  7. 使用visio创建跨职能流程图。
  8. 3dmax序列号输入之后显示该许可已在本计算机使用
  9. 服务器虚拟化技术笔试题,(虚拟化技术试题.docx
  10. Mybatis一对多关联查询详解