当前位置: 首页 > news >正文

长春做网站的公司哪家好中文搜索引擎网站

长春做网站的公司哪家好,中文搜索引擎网站,一般网站的字体大小,大余县网站自然语言处理初期发展历程 早期:离散表示 one-hot(只表达“有/无”,语义完全丢失)→ n-gram(局部上下文,但高维稀疏)→ TF-IDF(考虑词频与权重,但不能表达词关联&#x…

自然语言处理初期发展历程

早期:离散表示

        one-hot(只表达“有/无”,语义完全丢失)→ n-gram(局部上下文,但高维稀疏)→ TF-IDF(考虑词频与权重,但不能表达词关联),可见,缺点非常明显,达不到要求

过渡:分布式思想萌芽

       LSA等降维尝试,引入“词语义空间”思想,但非神经网络。
突破:神经网络分布式表示

NNLM(深度学习自动学语义嵌入,训练慢)
word2vec(极大提高训练效率与质量,催生“词嵌入”大潮流)

主流趋势

       低维、稠密、有语义的词向量成为自然语言理解基础,后续BERT等“上下文相关词向量”技术,是word2vec之后更高阶的语义学习。
       理念从“词级one-hot”→“全局加权”→“上下文分布”→“深度学习自学表示”。

小结

       one-hot、n-gram、TF-IDF:简单直观,但稀疏、高维、语义弱。
分布式表示、NNLM、word2vec:低维稠密,语义能力强,推动深度学习NLP大发展。
     从one-hot到word2vec,是NLP词表示从“人工特征”到“自动语义学习”的质变。

发展过程中,案例展示

一,one-hot

基本的语意:

对文本的表示:

优缺点:

二、TF-IDF

基础公式描述

公式表达: 

优缺点分析; 

三、N-gram

基础语法表达:

优缺点: 

语言模型: 

离散表示:

四、分布式

表示方法表示:

优缺点:

共现矩阵的表达方式

表达方式:

表达案例: 

优缺点: 

公式展现 

实现代码 

技术实现优缺点: 

五、NNLAM

样本案例:

公式: 

优缺点: 

六、word2vec

案例和算法图

二次方的概率: 

 

PCA实现二维可视化 

 

优缺点 

http://www.kf118.com/news/20.html

相关文章:

  • nginx怎么做多个网站百度推广找谁做靠谱
  • 海淀企业网站搭建做推广app赚钱的项目
  • wap搜索引擎在线优化工具
  • 极简风格的网站微信引流获客软件
  • 外管局网站先支后收怎么做报告网络营销理论
  • 网站做跳转的意义营销型网站建设的重要原则
  • 荥阳郑州网站建设徐州网站建设方案优化
  • 电子商务网站建设读书报告做网站的公司有哪些
  • 做关于什么内容的网站企业网站优化方案
  • 帝国网站管理怎样上传css样式东莞网络推广托管
  • 收银系统如何做好seo优化
  • 优对 网站开发怎么查询搜索关键词
  • 上海企业网站优化多少钱搜索引擎广告优化
  • 国外做机器的好的网站湖北百度关键词排名软件
  • 网站开发可演示的版本海口百度seo公司