自然语言处理资源大全

https://github.com/HIT-SCIR/pyltp

http://ltp.readthedocs.io/zh_CN/latest/

http://blog.csdn.net/churximi/article/details/51174182

http://www.cnblogs.com/ybf-yyj/p/7658571.html

http://blog.csdn.net/churximi/article/details/51174182

http://www.cnblogs.com/anderslly/p/jiebanet.html

https://www.codeproject.com/Articles/32201/Lucene-Net-Custom-Synonym-Analyzer

https://github.com/linezero/jieba.NET

https://github.com/anderscui/jieba.NET

https://www.ltp-cloud.com/

https://github.com/chapzq77/LTP_Python_Interface

https://github.com/NLPchina/nlp-lang

https://github.com/NLPchina/ansj_seg

http://www.nlpcn.org/resource/list/4

https://github.com/sing1ee/jieba-solr

https://www.nuget.org/packages/jieba.NET

https://python.libhunt.com/project/snownlp/vs/jieba

https://github.com/FudanNLP/fnlp

https://github.com/hankcs/HanLP/

https://github.com/crownpku/awesome-chinese-nlp

https://www.codeproject.com/Articles/32175/Lucene-Net-Text-Analysis

http://lucenenet.apache.org/

https://github.com/apache/lucenenet

https://github.com/JimLiu/Lucene.Net.Analysis.PanGu

https://github.com/LonghronShen/OurAspNet.Lucene.Net.Analysis.PanGu

1.Chinese NLP Toolkits 中文NLP工具

Toolkits 综合NLP工具包

Popular NLP Toolkits for English/Multi-Language 常用的英文或支持多语言的NLP工具包

Chinese Word Segment 中文分词

Information Extraction 信息提取

QA & Chatbot 问答和聊天机器人

2.Corpus 中文语料

3.Organizations 相关中文NLP组织和会议

4.Learning Materials 学习资料

Chinese NLP Toolkits 中文NLP工具

Toolkits 综合NLP工具包

THULAC 中文词法分析工具包by 清华 (C++/Java/Python)

NLPIRby 中科院 (Java)

LTP 语言技术平台by 哈工大 (C++)

FudanNLPby 复旦 (Java)

BosonNLPby Boson (商业API服务)

HanNLP(Java)

SnowNLP(Python) Python library for processing Chinese text

YaYaNLP(Python) 纯python编写的中文自然语言处理包,取名于“牙牙学语”

DeepNLP(Python) Deep Learning NLP Pipeline implemented on Tensorflow with pretrained Chinese models.

chinese_nlp(C++ & Python) Chinese Natural Language Processing tools and examples

Chinese-Annotator(Python) Annotator for Chinese Text Corpus 中文文本标注工具

Popular NLP Toolkits for English/Multi-Language 常用的英文或支持多语言的NLP工具包

CoreNLPby Stanford (Java)

NLTK(Python)

spaCy(Python)

OpenNLP(Java)

gensim(Python) Gensim is a Python library for topic modelling, document indexing and similarity retrieval with large corpora.

Chinese Word Segment 中文分词

Jieba 结巴中文分词(Python) 做最好的 Python 中文分词组件

kcws 深度学习中文分词(Python) BiLSTM+CRF与IDCNN+CRF

ID-CNN-CWS(Python) Iterated Dilated Convolutions for Chinese Word Segmentation

Genius 中文分词(Python) Genius是一个开源的python中文分词组件,采用 CRF(Conditional Random Field)条件随机场算法。

loso 中文分词(Python)

Information Extraction 信息提取

MITIE(C++) library and tools for information extraction

Duckling(Haskell) Language, engine, and tooling for expressing, testing, and evaluating composable language rules on input strings.

IEPY(Python) IEPY is an open source tool for Information Extraction focused on Relation Extraction.

Snorkel: A training data creation and management system focused on information extraction

Neural Relation Extraction implemented with LSTM in TensorFlow

A neural network model for Chinese named entity recognition

Information-Extraction-ChineseChinese Named Entity Recognition with IDCNN/biLSTM+CRF, and Relation Extraction with biGRU+2ATT 中文实体识别与关系提取

QA & Chatbot 问答和聊天机器人

Rasa NLU(Python) turn natural language into structured data

Rasa Core(Python) machine learning based dialogue engine for conversational software

Chatterbot(Python) ChatterBot is a machine learning, conversational dialog engine for creating chat bots.

Chatbot(Python) 基於向量匹配的情境式聊天機器人

Tipask(PHP) 一款开放源码的PHP问答系统,基于Laravel框架开发,容易扩展,具有强大的负载能力和稳定性。

QuestionAnsweringSystem(Java) 一个Java实现的人机问答系统,能够自动分析问题并给出候选答案。

使用TensorFlow实现的Sequence to Sequence的聊天机器人模型(Python)

使用深度学习算法实现的中文阅读理解问答系统(Python)

DuReader中文阅读理解Baseline代码(Python)

Corpus 中文语料

开放知识图谱OpenKG.cn

大规模中文概念图谱CN-Probase公众号介绍

CLDC中文语言资源联盟

中文 Wikipedia Dump

98年人民日报词性标注库@百度盘

百度百科100gb语料@百度盘密码neqs 出处应该是梁斌penny大神

搜狗20061127新闻语料(包含分类)@百度盘

UDChinese(for training spaCy POS)

中文word2vec模型

中文word2vec模型之维基百科中文使用2017年6月20日中文维基百科语料训练的脚本和模型文件。

Synonyms:中文近义词工具包基于维基百科中文和word2vec训练的近义词库,封装为python包文件。

Chinese_conversation_sentimentA Chinese sentiment dataset may be useful for sentiment analysis.

中文突发事件语料库Chinese Emergency Corpus

dgk_lost_conv 中文对白语料chinese conversation corpus

用于训练中英文对话系统的语料库Datasets for Training Chatbot System

八卦版問答中文語料

中国股市公告信息爬取通过python脚本从巨潮网络的服务器获取中国股市(sz,sh)的公告(上市公司和监管机构)

tushare财经数据接口TuShare是一个免费、开源的python财经数据接口包。

保险行业语料库[52nlp介绍Blog] OpenData in insurance area for Machine Learning Tasks

最全中华古诗词数据库唐宋两朝近一万四千古诗人, 接近5.5万首唐诗加26万宋诗. 两宋时期1564位词人,21050首词。

DuReader中文阅读理解数据

中文语料小数据包含了中文命名实体识别、中文关系识别、中文阅读理解等一些小量数据

中文人名语料库中文姓名,姓氏,名字,称呼,日本人名,翻译人名,英文人名。

中文数据预处理材料中文分词词典和中文停用词

漢語拆字字典

Organizations 相关中文NLP组织和会议

中国中文信息学会

NLP Conference CalenderMain conferences, journals, workshops and shared tasks in NLP community.

Learning Materials 学习资料

中文Deep Learning Book

Stanford CS224n Natural Language Processing with Deep Learning 2017

Oxford CS DeepNLP 2017

Speech and Language Processingby Dan Jurafsky and James H. Martin

52nlp 我爱自然语言处理

hankcs 码农场

文本处理实践课资料文本处理实践课资料,包含文本特征提取(TF-IDF),文本分类,文本聚类,word2vec训练词向量及同义词词林中文词语相似度计算、文档自动摘要,信息抽取,情感分析与观点挖掘等实验。

https://github.com/crownpku/Awesome-Chinese-NLP

<自已动手构造编译系统》GCC

https://github.com/fanzhidongyzby/cit/

https://code.google.com/archive/p/redis/#!

https://github.com/antirez/redis/

https://github.com/rabbitmq

https://github.com/rabbitmq/rabbitmq-dotnet-client

https://www.microsoft.com/en-us/cognitive-toolkit/

http://www.csharpkit.com/

https://github.com/mathnet

https://marketplace.visualstudio.com/items?itemName=ms-toolsai.vstoolsai-vs2015

https://marketplace.visualstudio.com/items?itemName=ms-toolsai.vstoolsai-vs2017

https://docs.microsoft.com/en-us/cognitive-toolkit/setup-cntk-on-your-machine

https://www.microsoft.com/en-us/cognitive-toolkit/features/model-gallery/

https://github.com/Microsoft/CNTK

https://github.com/migueldeicaza/TensorFlowSharp

http://www.csharpkit.com/2017-10-15_55288.html

https://github.com/Microsoft/vs-tools-for-ai


作者:readilen

链接:https://www.jianshu.com/p/f678372b0444

來源:简书

简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,332评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,508评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,812评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,607评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,728评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,919评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,071评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,802评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,256评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,576评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,712评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,389评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,032评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,798评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,026评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,473评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,606评论 2 350

推荐阅读更多精彩内容