文章首发于微信公众号「编程乐趣」,欢迎大家关注。

.Net平台上对Excel进行操作主要有两种方式。第一种,把Excel文件看成一个数据库,通过OleDb的方式进行读取与操作;第二种,调用Excel的COM组件。两种方式各有特点。

今天给大家介绍第三种方式:插件方式,目前主流框架大多需要将数据全载入到内存方便操作,但这会导致内存消耗问题,MiniExcel 尝试以 Stream 角度写底层算法逻辑,能让原本1000多MB占用降低到几MB,避免内存不够情况。

MiniExcel简单、高效避免OOM的.NET处理Excel查、写、填充数据工具。

特点

  • 低内存耗用,避免OOM、频繁 Full GC 情况

  • 支持即时操作每行数据

  • 兼具搭配 LINQ 延迟查询特性,能办到低消耗、快速分页等复杂查询

  • 轻量,不需要安装 Microsoft Office、COM+,DLL小于150KB

  • 简便操作的 API 风格

性能比较、测试

导入、查询 Excel 比较

逻辑 : 以 Test1,000,000x10.xlsx 做基准与主流框架做性能测试,总共 1,000,000 行 * 10 列笔 "HelloWorld",文件大小 23 MB。

导出、创建 Excel 比较

逻辑 : 创建1千万笔 "HelloWorld"

使用示例

1、读/导入 Excel

1.1 Query 查询 Excel 返回强型别 IEnumerable 数据

public class UserAccount
{public Guid ID { get; set; }public string Name { get; set; }public DateTime BoD { get; set; }public int Age { get; set; }public bool VIP { get; set; }public decimal Points { get; set; }
}var rows = MiniExcel.Query<UserAccount>(path);
// orusing (var stream = File.OpenRead(path))var rows = stream.Query<UserAccount>();

1.2 Query 查询支援延迟加载(Deferred Execution),能配合LINQ First/Take/Skip办到低消耗、高效率复杂查询

var row = MiniExcel.Query(path).First();
Assert.Equal("HelloWorld", row.A);// orusing (var stream = File.OpenRead(path))
{var row = stream.Query().First();Assert.Equal("HelloWorld", row.A);
}

与其他框架效率比较 :

1.3 读取大文件硬盘缓存 (Disk-Base Cache - SharedString)

概念 : MiniExcel 当判断文件 SharedString 大小超过 5MB,预设会使用本地缓存,如 10x100000.xlsx(一百万笔数据),读取不开启本地缓存需要最高内存使用约195MB,开启后降为65MB。但要特别注意,此优化是以时间换取内存减少,所以读取效率会变慢,此例子读取时间从 7.4 秒提高到 27.2 秒,假如不需要能用以下代码关闭硬盘缓存

var config = new OpenXmlConfiguration { EnableSharedStringCache = false };
MiniExcel.Query(path,configuration: config)

也能使用 SharedStringCacheSize 调整 sharedString 文件大小超过指定大小才做硬盘缓存

var config = new OpenXmlConfiguration { SharedStringCacheSize=500*1024*1024 };
MiniExcel.Query(path, configuration: config);

2、写/导出 Excel

  1. 必须是非abstract 类别有公开无参数构造函数

  2. MiniExcel SaveAs 支援 IEnumerable参数延迟查询,除非必要请不要使用 ToList 等方法读取全部数据到内存

2.1 支持集合<匿名类别>或是<强型别>

var path = Path.Combine(Path.GetTempPath(), $"{Guid.NewGuid()}.xlsx");MiniExcel.SaveAs(path, new[] {    new { Column1 = "MiniExcel", Column2 = 1 },    new { Column1 = "Github", Column2 = 2}});

2.2 IDataReader

  • 推荐使用,可以避免载入全部数据到内存

    推荐 DataReader 多表格导出方式(建议使用 Dapper ExecuteReader )

using (var cnn = Connection)
{cnn.Open();var sheets = new Dictionary<string,object>();sheets.Add("sheet1", cnn.ExecuteReader("select 1 id"));sheets.Add("sheet2", cnn.ExecuteReader("select 2 id"));MiniExcel.SaveAs("Demo.xlsx", sheets);
}

3、模板填充 Excel

  • 宣告方式类似 Vue 模板 {{变量名称}}, 或是集合渲染 {{集合名称.栏位名称}}

  • 集合渲染支持 IEnumerable/DataTable/DapperRow

3.1 基本填充

// 1. By POCO
var value = new
{Name = "Jack",CreateDate = new DateTime(2021, 01, 01),VIP = true,Points = 123
};
MiniExcel.SaveAsByTemplate(path, templatePath, value);
// 2. By Dictionary
var value = new Dictionary<string, object>()
{["Name"] = "Jack",["CreateDate"] = new DateTime(2021, 01, 01),["VIP"] = true,["Points"] = 123
};
MiniExcel.SaveAsByTemplate(path, templatePath, value);

3.2 复杂数据填充

// 1. By POCO
var value = new
{title = "FooCompany",managers = new[] {new {name="Jack",department="HR"},new {name="Loan",department="IT"}},employees = new[] {new {name="Wade",department="HR"},new {name="Felix",department="HR"},new {name="Eric",department="IT"},new {name="Keaton",department="IT"}}
};
MiniExcel.SaveAsByTemplate(path, templatePath, value);
// 2. By Dictionary
var value = new Dictionary<string, object>()
{["title"] = "FooCompany",["managers"] = new[] {new {name="Jack",department="HR"},new {name="Loan",department="IT"}},["employees"] = new[] {new {name="Wade",department="HR"},new {name="Felix",department="HR"},new {name="Eric",department="IT"},new {name="Keaton",department="IT"}}
};
MiniExcel.SaveAsByTemplate(path, templatePath, value);

4、Excel 列属性 (Excel Column Attribute)

4.1 指定列名称、指定第几列、是否忽略该列

public class ExcelAttributeDemo
{[ExcelColumnName("Column1")]public string Test1 { get; set; }[ExcelColumnName("Column2")]public string Test2 { get; set; }[ExcelIgnore]public string Test3 { get; set; }[ExcelColumnIndex("I")] // 系统会自动转换"I"为第8列public string Test4 { get; set; } public string Test5 { get; } //系统会忽略此列public string Test6 { get; private set; } //set非公开,系统会忽略[ExcelColumnIndex(3)] // 从0开始索引public string Test7 { get; set; }
}
var rows = MiniExcel.Query<ExcelAttributeDemo>(path).ToList();
Assert.Equal("Column1", rows[0].Test1);
Assert.Equal("Column2", rows[0].Test2);
Assert.Null(rows[0].Test3);
Assert.Equal("Test7", rows[0].Test4);
Assert.Null(rows[0].Test5);
Assert.Null(rows[0].Test6);
Assert.Equal("Test4", rows[0].Test7); 

4.2 DynamicColumnAttribute 动态设定 Column

 var config = new OpenXmlConfiguration{DynamicColumns = new DynamicExcelColumn[] { new DynamicExcelColumn("id"){Ignore=true},new DynamicExcelColumn("name"){Index=1,Width=10},new DynamicExcelColumn("createdate"){Index=0,Format="yyyy-MM-dd",Width=15},new DynamicExcelColumn("point"){Index=2,Name="Account Point"},}};var path = PathHelper.GetTempPath();var value = new[] { new { id = 1, name = "Jack", createdate = new DateTime(2022, 04, 12) ,point = 123.456} };MiniExcel.SaveAs(path, value, configuration: config);

Excel 类别自动判断

  • MiniExcel 预设会根据文件扩展名判断是 xlsx 还是 csv,但会有失准时候,请自行指定。

  • Stream 类别无法判断来源于哪种 excel 请自行指定

stream.SaveAs(excelType:ExcelType.CSV);
//or
stream.SaveAs(excelType:ExcelType.XLSX);
//or
stream.Query(excelType:ExcelType.CSV);
//or
stream.Query(excelType:ExcelType.XLSX);

文章首发于微信公众号「编程乐趣」,欢迎大家关注。 

.NET操作Excel高效低内存的开源框架 - MiniExcel相关推荐

  1. 盘点10个.NetCore实用的开源框架项目

    连续分享.Net开源项目快3个月了,今天我们一起梳理下10个,比较受到大家欢迎的.NetCore开源框架项目. 1.FytSoaCms 前后端分离CMS系统 项目简介 这是一个基于.Net 3构建的简 ...

  2. 大聪明教你学Java | EasyExcel - 用更简单的方式操作Excel

    前言 我们在开发应用系统的时候经常遇到操作或解析 Excel 的需求,我们在实现此功能的时候也都是借助 Apach POI 去操作 Excel,但是使用过这个框架的小伙伴都知道,这个框架并不是很好用, ...

  3. 低代码开源框架Appsmith

    什么是 Appsmith ? Appsmith 是一个用于构建内部应用程序的低代码.开源框架.通过拖放组件来构建完全自定义的管理面板.CRUD 应用程序和工作流.使用 30 多个 React 组件来构 ...

  4. 什么是工作流开源框架?可提高办公效率吗?

    如果要提高办公效率,那么采用什么样的软件可以实现?低代码开发平台是近些年得到不少企业喜爱的一种提高效率的软件平台,拥有表单设计.工作流引擎.微服务架构.代码开发套件等多个功能,这种企业级应用低代码开发 ...

  5. C#不要再使用Npoi啦,使用MiniExcel操作Excel文件更快更高效!

    1.简介 MiniExcel简单.高效避免OOM的.NET处理Excel查.写.填充数据工具. 目前主流框架如Npoi 需要将数据全载入到内存方便操作,但这会导致内存消耗问题. MiniExcel 尝 ...

  6. python excel 库 知乎_办公自动化利器openpyxl,高效操作excel的Python库

    你是不是会经常简单且重复地操作excel表格?并且这些操作的技术含量低. 本文给你介绍如何使用python高效操作excel,按照本文的教程,你可以快速高效地完成各种excel的骚操作. 你需要做的只 ...

  7. EasyExcel 低内存导出大数据量的Excel方案探索 50万行 50列 (附:实现代码)

    文章目录 1.前言 2.准备工作 3.导出测试 3.1.单次查询.全量导出 3.2. 多次查询,多个文件,单次写入 3.3.多次查询,多个文件,多次写入 3.4.多线程导出探索 3.5.文件打包成ZI ...

  8. POI 操作 Excel -大数据量高效读写

    前言 poi的读取的三种模式 模式 说明 读写性 SXSSF 内存中保留一定行数数据,超过行数,将索引最低的数据刷入硬盘 只写 eventmodel 基于事件驱动,SAX的方式解析excel,cup和 ...

  9. 微软开源Power Fx,基于Excel的低代码编程语言

    喜欢就关注我们吧! 微软宣布推出新的开源编程语言 Power Fx,一种基于 Microsoft Excel 的低代码公式语言:将可以在整个 Microsoft Power Platform 中进行使 ...

最新文章

  1. ubuntu mysql 5.7.19_在Ubuntu19下安装Mysql-5.7.24
  2. 网页编程,JS模态窗口,子页面向父页面传递值
  3. 【cocos2d-x】Lua中的table函数库
  4. zz[as3 hack技术]垃圾回收机强制执行
  5. Unity3D中常用的数据结构 学习
  6. 写一个简单的 django_post demo
  7. 菜鸟学数据库(四)——超键、候选键、主键、外键
  8. Javascript原型钩沉
  9. JDBC编程可能遇到的错误:java.sql.SQLException: The server time zone value 'Öйú±ê׼ʱ¼ä' is unrecognized or ..
  10. java kinect 人体识别_基于三个kinect的人体建模
  11. oracle会计事件,新的一年打开会计期发生错误
  12. Windows Phone 模拟器安装使用详解
  13. 黑白风格android,颜色风格略不同 黑白华为Mate对比图赏
  14. c#如何实现叫号操作_C#银行排队叫号系统
  15. 场效应管的分类及型号命名方法
  16. oracle存储过程sql拼接日期,Oracle 存储过程中的细节-日期处理
  17. 广东省数字经济行业发展动态及十四五前景预测分析报告2022-2027年
  18. 数据结构 | 有关树和二叉树的详解【内附考点精析】
  19. 程序员,如何从平庸走向理想?
  20. 根除 ff新鲜事 互联网毒瘤

热门文章

  1. Ubuntu18.04 设置Speaker为默认播放器
  2. Mac DataGrip 闪退问题
  3. 统计网站的用户访问量的实现
  4. vs code远程连接阿里云(SSH)
  5. 如何使用miniconda(小白入门版)
  6. Jeff的错题集(九):奥利给!
  7. java.lang.NoClassDefFoundError: javax/transaction/Synchronization 解决方法。
  8. Sketch之初见BF
  9. python 图灵机器人
  10. 无人驾驶汽车发展史大事纪实