前段时间在做一个项目的时候,遇到了要通过WEB SERVICE从服务器上返回数据量比较大的DATASET,当然,除了显示在页面上以外,有可能还要用这些数据在客户端进行其它操作。查遍了网站的文章,问了一些朋友,也找了一些解决方法.
        众所周知,如果不用其它方法,直接从WEB SERVICE上传回一个10W条记录的DATASET,可想而知的后果是什么,CPU要占用 100%,且要等上几分钟,这是任何一个项目都无法忍受的.在我上网找资料的过程中,试验了几种不同的方法,如通过压缩SOAP改善XML Web service性能,这篇文章所介绍的方法用了SOAP扩展,是通过在WEB SERVICE端用已经过时了的NZIPLIB库来压缩SOAP响应,据称文本压缩率可达80%.文章里面的代码是VB.NET的,费了好大劲翻译成C#的,照上面建项目,但是很可惜,我没有编译成功,总是出错.
这里我找我建好的项目提供大家下载,大家有时间看看是什么问题. SOAP压缩代码下载
       而后,找到了用序列化的方式来减少网络传输量,Microsoft .NET Framework 1.x 中内建两种将物件序列化的 Formatter类别,SoapFormatter 和 BinaryFormatter,两种方式均能减轻网络传输量提高性能,但SoapFormatter方式传输的方式其实还是XML形式,加了很多XML标识,因此压缩率不是很理想,BinaryFormatter用纯二进制的方式序列化DATASET,能使压缩率大大提高,这是台湾作者李匡正 (台灣微軟應用架構技術經理提供的例子里对SQL范例库Northwind的测试结果: <?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />

 

SoapFormatter 

BinaryFormatter 

Dataset 序列化後 Bytes 數 

1,953,078

1,448,399 

很显示然BinaryFormatter 明显优于SoapFormatter ,而我也确实用了BinaryFormatter 这种方式实现了提高效率.
再者,用微软提供的DataSetSurrogate 类可以此基础上进一步压缩数据大小,DataSetSurrogate 在.net 2.0里自带。这是比较结果.

  SoapFormatter BinaryFormatter
Dataset 序列化後Bytes數 1,953,078 1,448,399
DataSetSurrogate 序列化後Bytes數 2,371,942 575,684

在这里,有两种方式:可把序列化后的数据用文件形式保存在客户端硬盘;也可用Byte[]方式传回客户端,以下是代码。
web service 端(文件形式)

  [WebMethod(Description="循环获取远程DATASET")]
  public void SurrogateReadTable(string TableName)
  {
   //把DataSet通过Surrogate Class 序列化成 Binary Stream
  
   DataSet ds;
   ds=SqlHelper.ExecuteDataset(cnn,CommandType.Text,"select * from "+TableName);
   //实例化DataSetSurrogate,传取出的DATASET到构造函数里
   sds = new DataSetSurrogate(ds); 
   //实例化二进制流
   BinaryFormatter bf=new BinaryFormatter();
   StreamWriter swDat; 
   //写到本地一个文件里
   swDat = new StreamWriter(@"c:\output_surrogate_dataset.dat");
   bf.Serialize(swDat.BaseStream, sds);
   //这里可以知道序列化后的文件的大小
   long size = swDat.BaseStream.Length;
   swDat.Close();
  
  }

客户端

private void button1_Click(object sender, System.EventArgs e)
  {
   label1.Text=DateTime.Now.ToString();

   button1.Enabled=false;
   //反序列化Binary Stream能通过Surrogate Class转换成 DataSet

   //从WEB SERVICE上读取方法
   svs.SurrogateRead("t_busdocbase");
   BinaryFormatter bf=new BinaryFormatter();
   StreamReader swDat; 
   swDat = new StreamReader(@"c:\output_surrogate_dataset.dat");
   object o=bf.Deserialize(swDat.BaseStream);
  DataSet ds;
   sds = (DataSetSurrogate) o;
   ds = sds.ConvertToDataSet();
   dataGrid1.DataSource=ds.Tables[0];
   swDat.Close();
   }


web service 端(Byte[]方式)

[WebMethod(Description="获取业务资料远程DATASET")]
      public byte[] SurrogateRead1()
      {
       DataSet ds;
       ds=SqlHelper.ExecuteDataset(cnn,CommandType.Text,"select * from t_busdocbase");
       sds = new DataSetSurrogate(ds); 
       MemoryStream s= new MemoryStream();
       BinaryFormatter bf = new BinaryFormatter();
       bf.Serialize(s,sds);
     
       byte[] e = s.ToArray();
       return e; 
  
      }

客户端

private void button3_Click(object sender, System.EventArgs e)
   {
    label1.Text=DateTime.Now.ToString();

    button3.Enabled=false;
    //*反序列化Binary Stream能通过Surrogate Class转换成 DataSet*/

    //从WEB SERVICE上读取方法


     byte [] bb=svs.SurrogateRead1();
     MemoryStream br=new MemoryStream(bb);
     BinaryFormatter bf=new BinaryFormatter();
     object o=bf.Deserialize(br);
     sds = (DataSetSurrogate) o;
     ds = sds.ConvertToDataSet(); 
     dataGrid1.DataSource=ds.Tables[0];

     br.Close();

    }


我个人觉得用byte[]方式会安全些,毕竟不用在客户端产生文件,不用担心数据的安全。

当然作为从网络上读取数据来说,10W条是一个不小量,所有的方式包括压缩,序列化等都是权宜之计,而不是长久之计,在使用当中,我用以上的方法虽然能使网络传输量降低,且可在很短时间内就把数据显示在DATAGRID上,但CPU的开销却达到了100%,这是我一直头疼的。我后来又用了分页的方式,把10W条数据在服务器端就分批取出,每次500条,这样读取时间延长了,但CPU开销却未减轻很多,再后来,又用多线程的方式处理,不甚理想。因此最好的方法就是尽可能的不查询10W条数据,通过条件判断等方式减少所需处理的数据量。

本文从以下文章里借鉴:
http://www.dotnetjunkies.com/PrintContent.aspx?type=tutorial&id=46630AE2-1C79-4D5F-827E-6C2857FF1D23

http://blog.joycode.com/5drush/archive/2004/05/28/22990.aspx

http://www.chinacs.net/archives/11/2004/08/10/2155.html

http://www.microsoft.com/taiwan/msdn/columns/adonet/AdoNet_20041231.htmhttp://www.microsoft.com/china/msdn/library/langtool/vcsharp/miszipcompression.mspx

转载于:https://www.cnblogs.com/flyskywlh/archive/2005/08/18/217382.html

从WEB SERVICE 上返回大数据量的DATASET相关推荐

  1. WEB Service 下实现大数据量的传输

    Vs2005里面的,查询12000条记录,设置RemotingFormat = SerializationFormat.Binary; 再序列化,通过WebService传输,客户端接收,再反序列化, ...

  2. WEB Service 下实现大数据量的传输

    Vs2005里面的,查询12000条记录,设置RemotingFormat = SerializationFormat.Binary; 再序列化,通过WebService传输,客户端接收,再反序列化, ...

  3. 解决el-select后台一次返回大数据量渲染慢导致页面卡顿的问题

    场景一 解决了一次性渲染大量数据问题 业务场景是后台一次返回10万多条数据需要在下拉框中展示,直接渲染会导致页面卡顿且需要很长时间等待,用户体验极差,所以我把这个改造了一下,直接上代码, 里面注释写的 ...

  4. SQL千万级大数据量查询优化

    转发自:https://blog.csdn.net/long690276759/article/details/79571421?spm=1001.2014.3001.5506* (防止查询资料找不到 ...

  5. Mysql千万级大数据量查询优化

    1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引. 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索 ...

  6. 大数据量时Mysql的优化要点

    原文章 http://www.open-open.com/lib/view/open1430901016179.html 如今随着互联网的发展,数据的量级也是撑指数的增长,从GB到TB到PB.对数据的 ...

  7. 大数据量时Mysql的优化要点[转]

    转自:http://www.open-open.com/lib/view/open1430901016179.html 如今随着互联网的发展,数据的量级也是撑指数的增长,从GB到TB到PB.对数据的各 ...

  8. 大数据量高并发访问的数据库优化方法

    一.数据库结构的设计 如果不能设计一个合理的数据库模型,不仅会增加客户端和服务器段程序的编程和维护的难度,而且将会影响系统实际运行的性能.所以,在一个系统开始实施之前,完备的数据库模型的设计是必须的. ...

  9. 大数据量高并发的数据库优化(转)

    参考:http://www.cnblogs.com/chuncn/archive/2009/04/21/1440233.html 一.数据库结构的设计 如果不能设计一个合理的数据库模型,不仅会增加客户 ...

最新文章

  1. java主动抛出400异常_400个线程同时查询数据,抛出一个异常
  2. 告诉你KVC的一切-b
  3. ios/android代码生成FLASH可用的actionscript代码(*.ane)
  4. Build OpenVSwitch and OVN
  5. Microtransactions
  6. 我的Android进阶之旅------gt;解决Jackson等第三方转换Json的开发包在开启混淆后转换的实体类数据都是null的bug...
  7. fileitem方法_FileItem类的常用方法(关于文件上传的)
  8. windows server 文件资源管理服务器为指定的ftp用户开启磁盘配额
  9. 华为交换机默认用户名密码bootrom密码
  10. python语法元素合集
  11. 小米:VR产业中Android的现状与挑战
  12. 防火墙iptables和firewall相关操作
  13. 传奇类手游是怎么做推广的?
  14. Centos7- wget未找到命令,there are no enabled repos 解决办法
  15. ios-跳转到苹果自带地图进行导航
  16. 【数字IC验证快速入门】11、Verilog TestBench(VTB)入门
  17. 记2020年第十一届蓝桥杯感想
  18. STM32CUBE+自平衡车-前言
  19. 租用游戏服务器的优势
  20. 杭州的红绿灯竟然是位“诗人”在管

热门文章

  1. 前端页面紫红色_谷歌正在开发一种神秘的新型移动操作系统,称为紫红色
  2. redis最大储存512m_redis系列篇01
  3. 山东计算机类好的民办大学,山东四大坑人学校-山东坑人的民办大学(野鸡大学)...
  4. linux内核功能有,好消息!LINUX内核2.6.18终于支持实时功能了
  5. PAT(甲级)2021年春季考试 7-4 Recycling of Shared Bicycles
  6. Java培训深度学习都要学什么
  7. java 获取init参数,Java如何读取servlet init参数?
  8. mysql启动与关闭(手动与自动)
  9. 11.python并发入门(part9 多进程模块multiprocessing基本用法)
  10. 项目ITP(五) spring4.0 整合 Quartz 实现任务调度