随着数字化进程的加速,企业越来越重视数据的价值。根据IDC预计,全球大数据市场规模在2019年将达到1870亿美金。其中,企业除了关注自身的经营数据之外,对于外部数据,尤其是与自身息息相关的(如竞品动态、舆情信息等)数据也非常关注。

在获取这些数据时,最常用的手段就是爬虫技术。但传统的爬虫开发难度大,除了需要自己搭建服务器并运维,还需要工程师根据爬取需求编写代码、对接代理服务等等。计算下来,企业平均每月开发和运维成本往往需要上万元。

而猎云网今天带来的“神箭手”则为个人开发者和企业提供了简单便捷的爬虫工具。该项目创始人吴桐2013年硕士毕业于西安交大软件工程专业,毕业后加入谷歌搜索基础设施组,2014年离开谷歌创办壁虎数据恢复项目。

2015年8月,吴桐再度出发创办神箭手,从爬虫切入,希望把谷歌的大数据开发的管理理念带给更多用户。其核心创始团队都是吴桐的大学同窗,从大三时期就与吴桐一起创业。吴桐向猎云网独家透露,神箭手曾于2015年11月获得过来自中路资本的数百万元天使轮融资。

吴桐介绍,神箭手致力于成为一个一站式大数据应用开发平台,旨在通过为客户提供完整的开发架构和套件,降低大数据和AI应用开发的部署难度,实现从数据采集、清洗、训练、导出的完整生命周期。

当然,对于尚在起步阶段的神箭手来说,实现完整数据处理周期尚需时日。不过,该平台已经在第一步的数据采集方面体现出了自己的特点与优势。“爬虫市场”就是其中之一。

为了最大限度降低个人开发者和企业使用爬虫的技术门槛,神箭手团队自行编写了上百个爬虫,使用者无需关注如何设置IP、如何设置验证码,甚至对编程一窍不通的小白用户,也可以直接使用。

  神箭手操作界面

据猎云网了解,神箭手提供的爬虫可爬取的数据源囊括社交、电商、生活服务、互金、休闲旅游、汽车交通、医疗健康以及其他等多种分类。包括微博、淘宝、天猫、京东等网站的爬虫,都能在爬虫市场中找到。

值得一提的是,神箭手提供的爬虫目前全部都是团队自行编写。之所以尚未提供第三方开发者编写的爬虫,吴桐认为,爬虫对于代码编写技术要求较高,否则在运行时稳定性将受到影响。

虽然如此,但吴桐强调,现在的神箭手并非仅仅提供傻瓜式爬虫,而是一个开发平台。如果平台提供的爬虫无法满足用户需求,那么有开发实力的用户也可以在神箭手平台上自行编写爬虫并使用,并且平台对于这种用户还会有一定的鼓励。

除爬虫以外,目前平台也提供了诸多API调用。“其实,无论是爬虫还是API,甚至是直接购买数据池,都是用户获取数据的方式。我们希望夯实数据采集的第一步,再为用户提供后续的数据服务。”吴桐说。

在商业模式上,神箭手采用的是销售计算节点(服务器)的方式,每个节点79元,节点越多,爬虫爬取的速度越快。当然,平台也有套餐销售,根据节点数不同分为个人版和企业版。用户购买节点之后,根据爬虫所适用的最低套餐即可使用爬虫。而API则根据调用次数进行收费。

自2015年底产品上线以来,神箭手已积累了超过4万名用户注册使用,其中包括500多家企业套餐付费客户,目前月收入已超过20万元。

在数据采集器市场,其实已有包括八爪鱼这种工具存在。对于细分领域的竞争,吴桐认为,八爪鱼等产品是以软件形式存在,必须本地运行,这在数据爬取和软件更新时就会有所限制。而神箭手则是云服务形式,更灵活,自主性更强。另外其更专注对头部网站的爬取,这也是客户的重点需求。

接下来,吴桐透露,神箭手在解决了第一步数据采集之后,就要向云端机器学习、数据清洗、BI等后续环节迈进。另外,为企业提供私有化部署也是神箭手下一阶段的计划之一。

未来,吴桐希望能够将谷歌的代码管理理念融入神箭手,现在正在进行运行权限管理的研发,在未来实现云协同开发。

目前,该项目正在进行新一轮融资。

本文转自d1net(转载)

天使轮获数百万投资,神箭手从爬虫切入构建大数据应用开发平台相关推荐

  1. 玩具租赁品牌“玩巨人”获数百万元天使轮融资

    9月13日消息,据亿欧报道,玩具租赁品牌"玩巨人"获数百万元天使轮融资,投资方为欧洲DHS财团.杉杉基金.通大集团.本轮融资用于首批玩具租赁终端的制造.投放及运营. 玩巨人是一家用 ...

  2. 在线真人角色扮演,剧本杀“百变大侦探”获数百万元天使融资

    10月15日消息,剧本杀"百变大侦探"官方宣布获数百万元天使轮融资,本轮融资由"电竞女神"小苍及多名著名电竞主播共同投资.资金主要用于原创剧本的签约.用户的营销 ...

  3. 自主研发智能扭蛋机,快乐扭蛋获数百万 Pre-A 轮融资

    8月20日消息,今年 6 月扭蛋机品牌"快乐扭蛋"获数百万 Pre-A 轮融资,投资方为武汉一家上市公司个人股东.此前,快乐扭蛋曾获梅花创投个人投资人千万级天使轮融资. 快乐扭蛋成 ...

  4. 神箭手云爬虫平台 如何在1小时内编写简单爬虫

    既然你来到了这里,想必你肯定已经知道了神箭手云爬虫平台是干什么的,目的也是非常的明确. 那么接下来的过程中,我将给你演示如何在最快时间内编写一个简单的爬虫,每一个属性的讲解,将会让你一路顺风. dem ...

  5. 如何在神箭手云爬虫上写爬虫

    摘要   上一篇博客跟大家详细介绍了如何写出<黄焖鸡米饭是怎么火起来的>这样的数据分析类的文章,相信很多人都对数据来源也就是如何爬取到黄焖鸡米饭商家信息很感兴趣.那么今天我就跟大家具体讲一 ...

  6. 联系我们-神箭手云爬虫开发平台

    联系我们-神箭手云爬虫开发平台 联系我们-神箭手云爬虫开发平台 posted on 2016-07-22 17:54 lexus 阅读(...) 评论(...) 编辑 收藏 转载于:https://w ...

  7. 神箭手-云爬虫开发平台

    神箭手-云爬虫开发平台 神箭手-云爬虫开发平台 posted on 2016-07-22 17:55 lexus 阅读(...) 评论(...) 编辑 收藏 转载于:https://www.cnblo ...

  8. 杭州数澜联合创始人 \u0026 CTO 江敏:大数据思维和大数据冶炼 —— 拒绝坐着金山吃馒头...

    大家好,我是江敏,来自杭州数澜科技.我在 2007 年加入同花顺,前期主要做服务端的架构研发,后期主要负责组建同花顺大数据团队和构建大数据平台.2013 年,我加入阿里数据平台事业部数据服务团队,构建 ...

  9. 全国首个海洋大数据交易服务平台交易额破百万

    最近,北京比特大陆科技有限公司在推进海上风电业务的过程中需要风场.波浪场.流场等海洋环境分析数据,花费23万元购得了多项海洋领域专业数据.无独有偶,中国海洋大学也花费32万元购买了包括海洋大气预报数据 ...

最新文章

  1. ctags,cscope,nerdtree,tmux 笔记
  2. spark 朴素贝叶斯
  3. 转:从零开始开发一款Android App (from 简书)
  4. c++99乘法表_nine-nine table 不是“99张桌子”,理解错了数学老师会打你!
  5. DCMTK3.6.0(MD支持库)安装说明-无图版
  6. 09-Python入门学习-函数基础与参数
  7. 如何证明一个问题是NP-Hard或NP-Complete?
  8. java移位运算_Java移位运算符 “
  9. qpsk频谱图matlab,基于MATLAB的QPSK信号调制技术及其频谱分析
  10. beyond compare 注册表删除
  11. 12306 外包给阿里巴巴、IBM 等大企业做是否可行?
  12. java excel 分页合并_Excel办公技巧——完整显示跨页合并的单元格
  13. strcat、strcpy、strcmp三种函数用法
  14. outlook 服务器身份验证,Outlook 加载项中的身份验证选项
  15. 微信小程序低功耗蓝牙BLE快速开发js
  16. bind blz mysql_MySQL™ 参考手册(通用安装指南)
  17. hadoop全家桶部署手册hadoop-solr-ranger-atlas-hive-hbase...
  18. 微信小程之swiper
  19. Flutter 新手之路,报错记录01
  20. 计算机图形学【GAMES-101】1、矩阵变换原理Transform(旋转、位移、缩放、正交投影、透视投影)

热门文章

  1. X210学习--在ubuntu20.04 安装搭建交叉编译链
  2. 2011年电赛综合测评
  3. gre 填空43-63
  4. 如何用QT做消消乐游戏(简单版羊了个羊)
  5. redis设计原理009持久化策略
  6. Redis原理之 持久化
  7. 计算机二级c语言正确的做题顺序,雅思阅读:成绩提高的实践经验总结
  8. 极客班GeekBand - 互联网思维修炼 - 1
  9. 快速搭建electron-vue脚手架
  10. 4.Flink实时项目之数据拆分