MY SKILLS TO GRASP

Java（熟练掌握后端的基础组件，如监控系统，部署系统，数据库，消息队列，RPC，负载均衡等）

熟悉常用的算法和数据结构、（操作系统、编译原理有基本的了解），清楚代码时间与空间复杂度

NLP自然语言处理（分词，词性标注、实体识别、意图识别、情感分析、语法分析、语义分析、情感分析、摘要、自然语言生成等对话系统中的相关工作）

熟悉常用的自然语言处理方法，包括但不限于HMM、CRF、word2vec;机器翻译、计算机视觉、语音识别

Python

文本挖掘技术（实现文本聚类分类，知识提取、知识图谱构建、实体消歧、语义搜索等研发工作）

熟悉主流的no sql数据库，如mongoDB、HBase、redis;

了解常见的消息系统，例如mq、kafaka

神经网络等核心算法

常用机器学习算法和工具

基于数据驱动的人工智能算法

量化平台后端引擎算法研究与系统开发工作

TCP/IP、HTTP等各种常用通讯协议

实际的CAAS或PAAS的开发，以及使用经验

负责制定网络数据抓取规则，数据的提取、清洗、入库以及汇总的开发工作；

负责传统网页、电商网站、社会化媒体网站等互联网数据的高效采集与正确解析；

网络爬虫，query分析，文本分类，topic聚类等

负责搜索爬虫的核心技术研究与开发，搜索前沿爬虫技术并实践；网页采集、Hbase等相关开发经验者优先，从结构化的和非结构化的数据中获取信息

大规模分布式互联网爬虫系统的开发和维护，提升网页抓取效率和质量。

熟悉Hadoop/Lucene/Nutch/Solr等开源工具者优先；熟悉hadoop、spark、storm等大数据分析平台

搭建自己的GIT-HUB

最后编辑于：2017.12.04 05:41:02

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。