崗位職責:
1.負責分布式數(shù)據(jù)采集系統(tǒng)的設計與研發(fā)工作,實施互聯(lián)網(wǎng)相關(guān)數(shù)據(jù)的抓取和解析。
2.負責采集策略的設計與優(yōu)化工作,提升網(wǎng)頁抓取的效率和質(zhì)量,解決信息精準抽取等核心技術(shù)難題;
3.分析已有采集系統(tǒng)的技術(shù)缺陷,對策略架構(gòu)做出合理地調(diào)整和改進。
4.負責公司數(shù)據(jù)中心的運營和維護。
崗位要求:
1.計算機類及相關(guān)專業(yè)本科及以上學歷;
2.精通一門以上的主流開發(fā)語言(Python、Java),熟悉常用的數(shù)據(jù)抓取策略和原理;
3.具有大規(guī)模網(wǎng)頁爬蟲開發(fā)經(jīng)驗優(yōu)先,掌握爬蟲開發(fā)原理,能夠分析網(wǎng)站的結(jié)構(gòu)特點與規(guī)律;
4.對算法設計和數(shù)據(jù)結(jié)構(gòu)有深刻的理解,精通網(wǎng)絡編程;
5.有分布式爬蟲架構(gòu)經(jīng)驗者優(yōu)先;
6.強烈的責任心和良好的團隊合作精神,較好的溝通能力,善于學習新知識,能承擔較大的工作壓力。
1.負責分布式數(shù)據(jù)采集系統(tǒng)的設計與研發(fā)工作,實施互聯(lián)網(wǎng)相關(guān)數(shù)據(jù)的抓取和解析。
2.負責采集策略的設計與優(yōu)化工作,提升網(wǎng)頁抓取的效率和質(zhì)量,解決信息精準抽取等核心技術(shù)難題;
3.分析已有采集系統(tǒng)的技術(shù)缺陷,對策略架構(gòu)做出合理地調(diào)整和改進。
4.負責公司數(shù)據(jù)中心的運營和維護。
崗位要求:
1.計算機類及相關(guān)專業(yè)本科及以上學歷;
2.精通一門以上的主流開發(fā)語言(Python、Java),熟悉常用的數(shù)據(jù)抓取策略和原理;
3.具有大規(guī)模網(wǎng)頁爬蟲開發(fā)經(jīng)驗優(yōu)先,掌握爬蟲開發(fā)原理,能夠分析網(wǎng)站的結(jié)構(gòu)特點與規(guī)律;
4.對算法設計和數(shù)據(jù)結(jié)構(gòu)有深刻的理解,精通網(wǎng)絡編程;
5.有分布式爬蟲架構(gòu)經(jīng)驗者優(yōu)先;
6.強烈的責任心和良好的團隊合作精神,較好的溝通能力,善于學習新知識,能承擔較大的工作壓力。
職位類別: JAVA
舉報溫馨提示

- 你可能感興趣的職位
- 最近瀏覽記錄
-
25-35k
-
4-7k
-
6-18k
-
10.8-16.6k
-
6-9k
-
8-10k
-
7-9k
-
6-8k
暫沒有相關(guān)信息
- 所屬行業(yè):IT行業(yè)-計算機、互聯(lián)網(wǎng)、通訊、電子、儀器儀表等
- 所在地區(qū):北京
- 聯(lián)系人:曹云會
- 手機:會員登錄后才可查看
- 郵箱:會員登錄后才可查看
- 郵政編碼:
工作地址
- 地址: