有时需要从PowerPoint幻灯片中提取文本以执行文本分析。另一方面,可能需要提取文本并将其保存在文件或数据库中以进行进一步处理。因此,本文介绍了如何使用C#从PowerPoint演示文稿中提取文本。特别是,将学习如何从特定的幻灯片或整个演示文稿中提取文本。

  • 从PowerPoint幻灯片中提取文本
  • 从PowerPoint演示文稿中提取文本

为了处理PowerPoint演示文稿,Aspose提供Aspose.Slides for .NET旨在在.NET应用程序中实现PowerPoint自动化功能。它还提供了一些简单的方法来从PPTX演示文稿中提取文本。

>>你可以获取下载Aspose.Slides 最新版测试体验。


从C#中的PowerPoint幻灯片中提取文本

以下是从PowerPoint演示文稿中的幻灯片中提取文本的步骤。

  • 使用Presentation类加载演示文稿。
  • 使用SlideUtil.GetAllTextBoxes()方法将一张幻灯片中的所有文本框获取到ITextFrame数组中。
  • 遍历每个ITextFrame并使用ITextFrame.Paragraphs属性访问其文本。
  • 从段落的每个章节中检索并打印文本。

下面的代码示例演示如何使用C#从PowerPoint幻灯片中提取文本。

//Instatiate PresentationEx class that represents a PPTX file
Presentation pptxPresentation = new Presentation("demo.pptx");//Get an Array of TextFrameEx objects from the first slide
ITextFrame[] textFramesSlideOne = SlideUtil.GetAllTextBoxes(pptxPresentation.Slides[0]);//Loop through the Array of TextFrames
for (int i = 0; i < textFramesSlideOne.Length; i++)//Loop through paragraphs in current TextFrameforeach (Paragraph para in textFramesSlideOne[i].Paragraphs)//Loop through portions in the current Paragraphforeach (Portion port in para.Portions){//Display text in the current portionConsole.WriteLine(port.Text);//Display font height of the textConsole.WriteLine(port.PortionFormat.FontHeight);//Display font name of the textConsole.WriteLine(port.PortionFormat.LatinFont.FontName);}}
}

从C#中的PowerPoint演示文稿中提取文本

还可以使用Aspose.Slides for .NET从整个PowerPoint演示文稿中提取文本。以下是执行此操作的步骤。

  • 使用Presentation类加载演示文稿。
  • 使用SlideUtil.GetAllTextFrames()方法获取演示文稿中的所有文本框架。
  • 遍历每个ITextFrame并访问其Paragraphs。
  • 访问段落的各个部分并打印其文本。

下面的代码示例演示如何从PowerPoint演示文稿中提取文本。

//Instatiate Presentation class that represents a PPTX file
Presentation pptxPresentation = new Presentation("demo.pptx");//Get an Array of ITextFrame objects from all slides in the PPTX
ITextFrame[] textFramesPPTX = Aspose.Slides.Util.SlideUtil.GetAllTextFrames(pptxPresentation, true);//Loop through the Array of TextFrames
for (int i = 0; i < textFramesPPTX.Length; i++)//Loop through paragraphs in current ITextFrameforeach (IParagraph para in textFramesPPTX[i].Paragraphs)//Loop through portions in the current IParagraphforeach (IPortion port in para.Portions){//Display text in the current portionConsole.WriteLine(port.Text);//Display font height of the textConsole.WriteLine(port.PortionFormat.FontHeight);//Display font name of the textif (port.PortionFormat.LatinFont != null)Console.WriteLine(port.PortionFormat.LatinFont.FontName);}}
}

如果您有任何疑问或需求,请随时加入Aspose技术交流群(761297826),我们很高兴为您提供查询和咨询。

PPT处理控件Aspose功能演示:使用C#从PowerPoint文件中提取文本相关推荐

  1. PPT处理控件Aspose.Slides功能演示:使用 C# 在 PowerPoint 演示文稿中创建 SmartArt

    演示文稿中的 SmartArt 用于以视觉形式提供信息.有时,选择使简单的文本更具吸引力.而在其他情况下,它用于演示流程图.流程.不同实体之间的关系等.下面将介绍如何使用 C# 以编程方式在 Powe ...

  2. PPT开发控件 Aspose.Slides for Java 授权须知

    Aspose.Slides是一款用于生成,管理和转换PowerPoint幻灯片的本机API,可以使用多种格式,而不需要Microsoft PowerPoint.并且可在任何平台上操作PowerPoin ...

  3. 【更新】PPT管理控件Aspose.Slides V17.5发布 | 附下载

    2019独角兽企业重金招聘Python工程师标准>>> Aspose.Slides for .NET 17.5 功能和改进 核心 概述 类别 SLIDESNET-38576 生成的S ...

  4. Word处理控件Aspose.Words功能演示:在 C# 中从 Word 文档中提取文本

    从 Word 文档中提取文本通常在不同的场景中执行.例如,分析文本,提取文档的特定部分并将它们组合成单个文档,等等.在本文中,您将学习如何使用 C# 以编程方式从 Word 文档中提取文本.此外,我们 ...

  5. CAD处理控件Aspose.CAD功能演示:在 C#中以编程方式搜索 DWG 图形文件中的文本

    Aspose.CAD 是一个独立的类库,以加强 Java应用程序处理和渲染CAD图纸,而不需要AutoCAD或任何其他渲染工作流程.该CAD类库允许将DWG, DWT, DWF, DWFX, IFC, ...

  6. 文档控件Aspose概述:带你全面了解Aspose产品特点

    Aspose于2002年3月在澳大利亚悉尼创建,旗下产品覆盖文档.图表.PDF.条码.OCR.CAD.HTML.电子邮件等各个文档管理领域,为全球.NET .Java.C ++等10余种平台开发人员提 ...

  7. Word处理控件Aspose.Words功能演示:使用 C# 在 Word 文档中创建和修改 VBA 宏

    Aspose.Words 是一种高级Word文档处理API,用于执行各种文档管理和操作任务.API支持生成,修改,转换,呈现和打印文档,而无需在跨平台应用程序中直接使用Microsoft Word.此 ...

  8. Word处理控件Aspose.Words功能演示:用Java从Word文档中提取文本

    Aspose.Words For .NET是一种高级Word文档处理API,用于执行各种文档管理和操作任务.API支持生成,修改,转换,呈现和打印文档,而无需在跨平台应用程序中直接使用Microsof ...

  9. Word处理控件Aspose.Words功能演示:使用C#创建MS Word文档

    Aspose.Words是一种高级Word文档处理API,用于执行各种文档管理和操作任务.API支持生成,修改,转换,呈现和打印文档,而无需在跨平台应用程序中直接使用Microsoft Word. A ...

最新文章

  1. PHP的postman的bulk edit小功能:可以直接复制浏览器query string parameters的数据至postman的body的form-data 很方便 不用手写了
  2. 嵌入式Linux裸机开发(六)——S5PV210时钟系统
  3. VideoLAN,VLC和FFmpeg社区联合开发AV1解码器
  4. IP地址的简单说明---Linux学习笔记
  5. SAP S/4HANA Smart Business Filter is too complex - step by step
  6. Jury Compromise POJ - 1015
  7. 如何把我的Java程序变成exe文件?
  8. oracle 如何终止存储过程的运行
  9. mysql中 视图的优缺点_数据库视图优缺点分析
  10. [No0000DD]C# StringEx 扩展字符串类 类封装
  11. 清代考生是如何作弊?很是牛啊!
  12. VMware12序列号
  13. oneno浏览器插件_Send to OneNote 1.2.13
  14. 重心法选址迭代matlab,配送中心重心法选址的研究
  15. 电脑版微信多开的三种方法
  16. 360 面试 一面+二面
  17. 给我一把利剑,待我重整山河
  18. 四、地址空间与内存分配
  19. [DDR]2 - Initialization, Training and Calibration
  20. Skype免费网络电话瞄准主流市场

热门文章

  1. 行业“卷不动”、市场“换不动”,家电赛道又跑回“老路”
  2. Thymeleaf语法详解
  3. 电脑怎样操作截图?轻松小技巧!在电脑中如何进行截图?
  4. 前端如何实现一张电子发票页面
  5. AWTRIX时钟:一台可玩性极高的DIY时钟
  6. 如何成为一名优秀的项目经理。
  7. struts2-21常用标签解说
  8. [hge] distort.h distort.cpp
  9. UI测试的定义和相关概念
  10. 电影《银河护卫队3》观后感