大家好,我简单介绍一下本人在NLP领域的见闻,做个笑料!
NLP领域目前发展没有CV方向那么壮大!其原因,根据本人的所见所闻,在于当下工业界基于CV有较多的市场吧!例如,医学检测,人脸识别,异常检测,生产质量检测,生态质量检测等。然而,NLP可以落地的应用中,能塞满腰包的也就搜广推了!疫情之下,各厂缩减成本,没有绩效且成本又高的产线成为了首选被砍的目标。这年头,能有个班上,像牲口一样活着,就好过所有了。尽管如此,NLP的发展也在起起伏伏中不断向前发展。
NLP的发展一波三折。第一折,基于规则。第二折,基于统计学习方法。第三折,基于神经网络。
NLP领域涉及的知识点总结。
首先是数学,线性代数,微积分,概率论。
其次是数据结构与算法,排序搜索链栈堆,树图队列散列类,python, C++, java。
第三是机器学习,KNN,Perceptron, DT, LR,最大熵,AdaBoost, 朴素贝叶斯,HMM,CRF,EM,SVD,PCA,LSA,PLSA,LDA,MCMC,Pagerank,XGBoost, GBDT, FM, FFM等
第四是深度学习,MLP,CNN,RNN,LSTM,BiLSTM-CRF,EncoderDecoder(seq2seq),自动编码器等。
第五是自然语言处理,分词,fasttext, GloVe, ELMo, 词性标注,词法分析,句法分析,段落分析,篇章分析,语用分析,命名实体识别,实体抽取,实体链接,关系抽取,相似度检测,文本表示,文本分类,文本聚类,情感识别,观点挖掘,信息检索,自动摘要,自然语言理解,意图是别,槽位填充,对话管理,对话状态追踪,对话策略学习,文本生成,pytorch, tensorflow, NLTK, spacy等。
第六是知识图谱,知识表示与存储,知识推理,知识融合,基于知识图谱作问答,Neo4j, MySQL。
第七是transformer系列,attention, BERT, ALBERT, GPT, RoBERTa, distillBERT, XLNet, ResNet, YOLO2等等。
第八是大数据,spark, hadoop, hive, docker。
最后,还有多模态,多语言,少资源,零资源,提示,强化,联邦,对抗,元以及迁移学习等内容。
对未来的展望:
1. 规范化的语料库以及知识图谱会越来越完备。
2. 基于多模态,图(微表情)+音+文字的稠密向量表示预训练模型成为感知主流,基于知识图谱的符号逻辑推理会成为认知主流。
3. 未来NLP还会有更多的起伏,必然能成为AI领域最亮的那颗星。
NLP领域目前发展没有CV方向那么壮大!其原因,根据本人的所见所闻,在于当下工业界基于CV有较多的市场吧!例如,医学检测,人脸识别,异常检测,生产质量检测,生态质量检测等。然而,NLP可以落地的应用中,能塞满腰包的也就搜广推了!疫情之下,各厂缩减成本,没有绩效且成本又高的产线成为了首选被砍的目标。这年头,能有个班上,像牲口一样活着,就好过所有了。尽管如此,NLP的发展也在起起伏伏中不断向前发展。
NLP的发展一波三折。第一折,基于规则。第二折,基于统计学习方法。第三折,基于神经网络。
NLP领域涉及的知识点总结。
首先是数学,线性代数,微积分,概率论。
其次是数据结构与算法,排序搜索链栈堆,树图队列散列类,python, C++, java。
第三是机器学习,KNN,Perceptron, DT, LR,最大熵,AdaBoost, 朴素贝叶斯,HMM,CRF,EM,SVD,PCA,LSA,PLSA,LDA,MCMC,Pagerank,XGBoost, GBDT, FM, FFM等
第四是深度学习,MLP,CNN,RNN,LSTM,BiLSTM-CRF,EncoderDecoder(seq2seq),自动编码器等。
第五是自然语言处理,分词,fasttext, GloVe, ELMo, 词性标注,词法分析,句法分析,段落分析,篇章分析,语用分析,命名实体识别,实体抽取,实体链接,关系抽取,相似度检测,文本表示,文本分类,文本聚类,情感识别,观点挖掘,信息检索,自动摘要,自然语言理解,意图是别,槽位填充,对话管理,对话状态追踪,对话策略学习,文本生成,pytorch, tensorflow, NLTK, spacy等。
第六是知识图谱,知识表示与存储,知识推理,知识融合,基于知识图谱作问答,Neo4j, MySQL。
第七是transformer系列,attention, BERT, ALBERT, GPT, RoBERTa, distillBERT, XLNet, ResNet, YOLO2等等。
第八是大数据,spark, hadoop, hive, docker。
最后,还有多模态,多语言,少资源,零资源,提示,强化,联邦,对抗,元以及迁移学习等内容。
对未来的展望:
1. 规范化的语料库以及知识图谱会越来越完备。
2. 基于多模态,图(微表情)+音+文字的稠密向量表示预训练模型成为感知主流,基于知识图谱的符号逻辑推理会成为认知主流。
3. 未来NLP还会有更多的起伏,必然能成为AI领域最亮的那颗星。