最佳答案

首先,你这个想法还是很不错的,我以前也想这么做过。不过,学习html语言在这里肯定是次要的,主要的还是要学会分析的方法,而不是掌握被分析的内容,你说是吧?如果要用程序抓取网页自动保存到本地,就要会用socket编程,或者学习使用libcurl库,这些都比学html语言有用的多,不做网页抓取的时候,这些知识依然非常有用。而且,不同的网页,内容不同,规律可能也不同。比如你给的那个例子网址,我右键查看了源代码,里面就根本没有所谓的

、标签,即它的表格不是通过这些标签来实现的。所以,让你去看这些标签,就是南辕北辙了。网页分析,说到底还是字符串处理和分析。所以,你如果真的想学,不如好好学一下正则表达式和字符串处理相关的函数,以及函数库,比如tidy库等。正则表达式是用来匹配一类字符串的,方便找规律,也方便处理,你稍微学习一点点就知道有多么的强大,多么的有用了。而且,正则表达式跟语言无关,什么语言都能用得到,学这个不亏的。标准C库中没有正则表达式相关的函数,一般来说C中使用两种正则表达式库,一为POSIX C正则库,二为perl正则库PCRE。相比较而言PCRE要强大些,POSIX C正则库就足够使用。下面,这几个链接里面有网页分析的一些例子,虽然不都是C语言来处理的。但是,思路都是一致的。 所以,说到底,还是正则表达式、正则函数库、字符串处理函数这些才是根本。先说这些,希望对你有所帮助。如果你在学习过程中还有什么问题,欢迎随时交流:)C#的:http://www.jb51.net/article/16618.htmC#的:http://mytiu.blog.163.com/blog/static/1059718452009127112226478/这里还有一段C语言的代码, 是将下载下来的网页源代码处理成没有标签的纯文字文本#include #include #include #include int main(int argc, char **argv ){const char* input = "Foo

Foo!";TidyBuffer output = {0};TidyBuffer errbuf = {0};int rc = -1;Bool ok;TidyDoc tdoc = tidyCreate(); // Initialize "document"printf( "Tidying:\t%s\n", input );ok = tidyOptSetBool( tdoc, TidyXhtmlOut, yes ); // Convert to XHTMLif ( ok )rc = tidySetErrorBuffer( tdoc, &errbuf ); // Capture diagnosticsif ( rc >= 0 )rc = tidyParseString( tdoc, input ); // Parse the inputif ( rc >= 0 )rc = tidyCleanAndRepair( tdoc ); // Tidy it up!if ( rc >= 0 )rc = tidyRunDiagnostics( tdoc ); // Kvetchif ( rc > 1 ) // If error, force output.rc = ( tidyOptSetBool(tdoc, TidyForceOutput, yes) ? rc : -1 );if ( rc >= 0 )rc = tidySaveBuffer( tdoc, &output ); // Pretty Printif ( rc >= 0 ){if ( rc > 0 )printf( "\nDiagnostics:\n\n%s", errbuf.bp );printf( "\nAnd here is the result:\n\n%s", output.bp );}elseprintf( "A severe error (%d) occurred.\n", rc );tidyBufFree( &output );tidyBufFree( &errbuf );tidyRelease( tdoc );return rc;}

最佳答案由网友  SEOEngineer  提供

c语言如何实现自动打开网页,C语言,如何对网页进行操作?相关推荐

  1. c语言如何实现自动打开网页,如何在C语言中打开网页链接,谢谢大佬!!!

    #include #include int main() { float a,b,c,d;//定义好多个变量 char e[100]="我愿意";//为下面的选择做铺垫 char  ...

  2. c语言课程设计自动答题系统,C语言课程设计-单项选择题标准化考试系统设计.doc...

    PAGE 沈阳航空航天大学 课 程 设 计 报 告 课程设计名称:C语言课程设计 课程设计题目:单项选择题标准化考试系统设计 院(系): 计算机学院 专 业: 计算机科学与技术 班 级: 学 号: 姓 ...

  3. c语言文件打开方式字符串,C语言打开文件-C语言打开文件的方式-C语言以只读方式打开文件-C语言以读写方式打开文件-嗨客网...

    C语言打开文件教程 在 在 C 语言中,打开文件使用 fopen C语言fopen函数详解 语法 FILE *fopen(char *filename, char *mode); 参数 参数 描述 f ...

  4. c语言编程幼儿园自动分班,C语言课件 第5章选择结构.ppt

    C语言课件 第5章选择结构 第5章 选择结构程序设计 搜玛厚壶帛酒慈钝梢抽溢泣蒲滓桐惶移掣桩一森距埂蹋朴汛拇银瘴告逾符C语言课件 第5章选择结构C语言课件 第5章选择结构 主要内容:关系运算符和关系表 ...

  5. c语言程序运行时打开记事本,C语言打开一个记事本的内容!求助!

    #include #include struct student { int order; char num[11]; char name[20]; }; typedef struct student ...

  6. C语言结构体自动初始化实现,C语言中结构体(struct)的几种初始化方法

    本文给大家总结的struct数据有3种初始化方法 1.顺序 2.C风格的乱序 3.C++风格的乱序 下面通过示例代码详细介绍这三种初始化方法. 1)顺序 这种方法很常见,在一般的介绍C的书中都有介绍. ...

  7. C语言编译时无法打开文件,2812c语言编译时头文件无法打开

    引用:louiewong 写道: 全部错误显示如下: ------------------------------  pmsm.pjt - Debug  ----------------------- ...

  8. Vue 项目启动后在浏览器自动打开

    想要实现 Vue 项目在浏览器自动打开,只需要几步简单的操作就可以实现了.我这里是使用了Vue3.x的脚手架创建的项目,项目的目录架构你们有可能是和你们的不太一样,但是道理是这样子的道理.其他话不多说 ...

  9. 企业什么喜欢做电视看板,电视看板浏览网页的必备工具 电视看板浏览器 电视看板自动打开网页

    企业喜欢做电视看板主要是因为它可以提供以下几个方面的优势: 增强企业形象:电视看板可以将企业的信息和广告以更加生动.直观的方式呈现出来,提高企业形象和知名度. 提高工作效率:电视看板可以在企业内部作为 ...

最新文章

  1. 梁佳玉 - 昨天的爱
  2. eigen库安装_OpenCV+Eigen上位机程序移植(七十一)
  3. 利用oc门或od门实现线与_福师《数字逻辑》在线作业二答案
  4. 在PyCharm中自动添加文件头、时间日期等信息
  5. 如何优化js代码(2)——for循环
  6. Android中Socket大文件断点上传
  7. pdf复制到word有空格间隙和换行问题解决办法
  8. mac 蓝牙 串口调试 助手(工具)
  9. 项目经理需要具备四种基本素质及八大管理技能
  10. pdftomusic pro(音乐谱曲软件) v1.0.4
  11. 如何通过AdsPower保障Facebook账号登录稳定
  12. macbook黑屏_Mac Book突然黑屏开不了机怎么办
  13. 关于销售订单高级定价的一点疑惑
  14. x50pro怎么升级鸿蒙系统,被央视点赞的vivo X50 Pro拍照如何?实测告诉你
  15. Python科学计算的瑞士军刀——Anaconda 安装与配置
  16. 网络舆情信息查找网站与怎么查的方法详解
  17. Json解析后显示在listview控件上
  18. 显卡常识 电脑显卡基础知识普及
  19. 10.22css基础02
  20. 电脑鼠标右键失效linux,怎么解决鼠标右键失效的问题?

热门文章

  1. python输入三行、能出来三行数据_python输入多行字符串的方法总结
  2. SQL Server 创建索引时的注意事项
  3. mysql数据库文件移机_MySQL简易备份方法
  4. 求大神解答:msxml3.dll 错误 '80090326' 接收到的消息异常,或格式不正确。 /admin/admin_jijizy.asp,行 611:
  5. CentOS7 使用MEGAcmd 下载文件
  6. latex与文章写作心得
  7. XT交易所API接口文档
  8. WLAN漫游原理详解
  9. 小老板们打不了“价格战”,他们的出路在哪?
  10. 火星文转换php源码,简体/繁体/火星文转换