普通会员 | 共有职位:3
苏州企联互联网络科技有限公司
  企业简介 所有职位 招聘职位  
所有招聘职位
招聘:数据采集工程师 (全职) 职位类别:计算机软件 (全部)计算机软件类 招聘人数:1人
薪金待遇: 10000-20000元/月 招聘部门:
发布日期: 2016-11-15 截止日期: 2016-12-15
工作地区: 江苏 苏州 现所在地:
学历要求: 大专 工作年限: 一年以上
年龄要求: 不限 性别要求: 不限
联系人:18655064608联系电话:已被企业屏蔽
邮箱地址: [登录]查看!若您未注册请[免费注册]
联系地址:苏州工业园区东平街286号505室
公交路线:

职位描述 Description
工作职责:
1、 参与核心爬虫系统架构设计、数据库设计;
2、 负责网络爬虫的核心技术研究和开发;
3、 设计爬虫策略和防屏蔽规则,提升网页抓取的效率和质量;
4、 分析爬虫系统的技术缺陷,对策略架构做出合理地调整和改进;

技能要求:
1、 1年以上Java、python或C/C++开发经验,熟悉常用的信息抓取策略和数据重组方法;
2、 精通信息抓取和整合技术,从结构化的和非结构化的数据中获取信息,掌握正则表达式;
3、 熟悉大规模网页爬取,深度网页爬取,熟悉Nutch、Scrapy、Lucene、Heritrix、Solr、Sphinx等工具优先考虑;
4、熟悉Html,XML网页标记语言,熟悉基于Cookie的网站登录原理,熟悉基于正则表达式、Xpath、CSS等网页信息抽取技术,熟悉JS,ajax,网页消重;
5、熟悉Mysql数据库,了解Redis、Mongodb、HBase、HIVE等NoSQL数据库;
6、2年以上爬虫开发经验,有分布式爬虫架构经验优先;



  
『加入职位收藏夹』   『推荐给好友』    『该企业其他职位』
特别提醒:任何以招聘名义向求职人员收取费用的行为都是违法的,可向劳动监察部门投诉。
Copyright © 2016 www.chinaitjob.com. All Rights Reserved. 数字IT人才网 版权所有, 本站保留所有权利;页面运行时间: 0.16 秒
数字IT人才网信息产业部ICP备案: 粤ICP备15074009号